/[webpac]/trunk/parse_format.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/parse_format.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 22 by dpavlin, Sun Feb 23 00:01:08 2003 UTC revision 90 by dpavlin, Sun Jul 13 13:22:50 2003 UTC
# Line 1  Line 1 
1  #-------------------------------------------------------------  #-------------------------------------------------------------
2  #  #
3  # parse_format('format',$isis_row);  # parse_format(...)
4  #  #
5    
 use isis_sf;  
6    
7  sub parse_format {  sub parse_format {
8            my $type = shift || die "parset_format must be called with type!";
9            my $format = shift || die "parse_format must be called with format!";
10            my $row = shift || die "parse_format must be called with row!";
11            my $i = shift || 0;     # isis repeatable number
12            my $codepage = shift || die "parse_format must be called with codepage!";
13            if ($type eq "isis") {
14                    return parse_iso_format($format,$row,$i,$codepage,'isis_sf');
15            } elsif ($type eq "excel") {
16                    return parse_excel_format($format,$row,$i,$codepage);
17            } elsif ($type eq "marc") {
18                    return parse_iso_format($format,$row,$i,$codepage,'marc_sf');
19            } elsif ($type eq "feed") {
20                    return parse_feed_format($format,$row,$i,$codepage);
21            }
22    }
23    
24    #-------------------------------------------------------------
25    
26    sub parse_iso_format {
27    
28          my $format = shift;          my $format = shift;
29          my $row = shift;          my $row = shift;
30            my $i = shift;
31            my $codepage = shift;
32    
33            my $func = shift || die "need to know which sub-field function to use";
34    
35            require $func.".pm";
36    
37          my $out;          my $out;
38          my $out_swish;          my $out_swish;
39    
40          my $prefix = "";          my $prefix = "";
41          if ($format =~ s/^([^\d]+)//) {          if ($format =~ s/^([^\d]+)//) {
42                  $prefix = "pre: $1";                  $prefix = $1;
43          }          }
44    
45          my $display;          my $display;
46          my $swish;          my $swish;
47    
48            sub cnv_cp {
49                    my $codepage = shift;
50                    my $tmp = shift || return;
51                    if ($codepage) {
52                            $tmp = $codepage->convert($tmp) || print STDERR "iso: '$tmp' can't convert\n";
53                    }
54                    return $tmp;
55            }
56    
57          while ($format) {          while ($format) {
58  #print STDERR "#### $format\n";  #print STDERR "\n#### $format";
59                  if ($format =~ s/^(\d\d\d)(\w?)//) {                  # this is EBSCO special to support numeric subfield in
60                          my $isis_tmp = isis_sf($row,$1,$2);                  # form of 856#3
61                          if ($isis_tmp) {                  if ($format =~ s/^(\d\d\d)#*(\w?)//) {
62                                  $display .= $prefix . $isis_tmp;                          my $tmp = cnv_cp($codepage,get_sf($row,$1,$2,$i));
63                                  $swish .= $isis_tmp." ";                          if ($tmp) {
64                                    $display .= $prefix.$tmp;
65                                    $swish .= $tmp." ";
66    #print STDERR " == $tmp";
67                          }                          }
68                          $prefix = "";                          $prefix = "";
69                  # this might be our local scpeciality -- fields 10 and 11                  # this might be our local scpeciality -- fields 10 and 11
70                  # (as opposed to 010 and 011) so they are strictly listed                  # (as opposed to 010 and 011) so they are strictly listed
71                  # here                  # here
72                  } elsif ($format =~ s/^(1[01])//) {                  } elsif ($format =~ s/^(1[01])//) {
73                          my $isis_tmp = isis_sf($row,$1,$2);                          my $tmp = cnv_cp($codepage,get_sf($row,$1,undef,$i));
74                          if ($isis_tmp) {                          if ($tmp) {
75                                  $display .= $prefix . $isis_tmp;                                  $display .= $prefix.$tmp;
76                                  $swish .= $isis_tmp." ";                                  $swish .= $tmp." ";
77                          }                          }
78                          $prefix = "";                          $prefix = "";
79                    } elsif ($format =~ s/^mfn//i) {
80                            $display .= $prefix . $row->{mfn};
81                            $prefix = "";
82                  } elsif ($format =~ s/^([^\d]+)(\d{0,3})/$2/) {                  } elsif ($format =~ s/^([^\d]+)(\d{0,3})/$2/) {
83                          $prefix .= $1;                          $prefix .= $1 if ($display);
84                  } elsif ($format =~ s/^([^\d]+\d{0,2})//) {                  } elsif ($format =~ s/^([^\d]+\d{0,2})//) {
85                          $prefix .= $1;                          $prefix .= $1 if ($display);
86                  } elsif ($format =~ s/^(\d{1,2})//) {                  } elsif ($format =~ s/^(\d{1,2})//) {
87                          $prefix .= $1;                          $prefix .= $1 if ($display);
88                  } else {                  } else {
89                          print STDERR "unparsed format: $format\n";                          print STDERR "unparsed format: $format\n";
90                          $prefix .= $format;                          $prefix .= $format;
# Line 58  sub parse_format { Line 98  sub parse_format {
98  }  }
99    
100  #-------------------------------------------------------------  #-------------------------------------------------------------
101    
102    sub parse_excel_format {
103            my $format = shift;
104            my $row = shift;
105            my $i = shift;
106            my $codepage = shift;
107    
108            return if ($i > 0);     # Excel doesn't support repeatable fields
109    
110            my $out;
111            my $out_swish;
112    
113            my $prefix = "";
114            if ($format =~ s/^([^A-Z\|]{1,3})//) {
115                    $prefix = $1;
116            }
117    
118            my $display;
119            my $swish;
120    
121            while ($format && length($format) > 0) {
122    #print STDERR "\n#### $format #";
123                    if ($format =~ s/^\|([A-Z]{1,2})\|//) {
124    #print STDERR "--$1-> $format -[",length($format),"] ";
125                            if ($row->{$1}) {
126                                    my $tmp = $row->{$1};
127                                    if ($codepage) {
128                                            $tmp = $codepage->convert($tmp) || warn "excel: $1 '$tmp' can't convert";
129                                    }
130                                    $display .= $prefix . $tmp;
131                                    $swish .= $tmp." ";
132    #print STDERR " == $tmp";
133                            }
134                            $prefix = "";
135                    } elsif ($format =~ s/^([^A-Z\|]+)(\|[A-Z]{1,2}\|)/$2/) {
136                            $prefix .= $1 if ($display);
137                    } else {
138                            print STDERR "unparsed format: $format\n";
139                            $prefix .= $format;
140                            $format = "";
141                    }
142    #print STDERR " display: $display swish: $swish [format: $format]";
143            }
144            # add suffix
145            $display .= $prefix if ($display);
146    
147            return ($swish,$display);
148    }
149    
150    #-------------------------------------------------------------
151    
152    sub parse_feed_format {
153            my $format = shift;
154            my $data = shift;
155            my $i = shift;
156            my $codepage = shift;
157    
158            my $out;
159            my $out_swish;
160    
161            my $prefix = "";
162            if ($format =~ s/^([^\d\|]{1,3})//) {
163                    $prefix = $1;
164            }
165    
166            my $display;
167            my $swish;
168    
169            while ($format && length($format) > 0) {
170    #print STDERR "\n#### $format #";
171                    if ($format =~ s/^\|(\d+)\|//) {
172    #print STDERR "--$1-> $format -[",length($format),"] ";
173                            if ($data->{$1}) {
174                                    my $tmp = $data->{$1};
175                                    if ($codepage) {
176                                            $tmp = $codepage->convert($tmp) || warn "feed: $1 '$tmp' can't convert\n";
177                                    }
178                                    $display .= $prefix . $tmp;
179                                    $swish .= $tmp." ";
180    #print STDERR " == $tmp";
181                            }
182                            $prefix = "";
183                    } elsif ($format =~ s/^([^\d\|]+)(\|\d+\|)/$2/) {
184                            $prefix .= $1 if ($display);
185                    } else {
186                            print STDERR "unparsed format: $format\n";
187                            $prefix .= $format;
188                            $format = "";
189                    }
190    #print STDERR " display: $display swish: $swish [format: $format]";
191            }
192            # add suffix
193            $display .= $prefix if ($display);
194    
195            return ($swish,$display);
196    }
197    
198    #-------------------------------------------------------------
199    
200  1;  1;

Legend:
Removed from v.22  
changed lines
  Added in v.90

  ViewVC Help
Powered by ViewVC 1.1.26