/[webpac]/branches/ffzg/all2xml.pl
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /branches/ffzg/all2xml.pl

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 633 by dpavlin, Sun Jan 16 18:57:15 2005 UTC revision 652 by dpavlin, Thu Jan 27 21:17:47 2005 UTC
# Line 22  die "FATAL: can't find configuration fil Line 22  die "FATAL: can't find configuration fil
22  my $config;  my $config;
23    
24  #use index_DBI;         # default DBI module for index  #use index_DBI;         # default DBI module for index
25  use index_DBI_cache;    # faster DBI module using memory cache  #use index_DBI_cache;   # faster DBI module using memory cache
26    use index_DBI_filter;   # filter support for indexes
27  my $index;  my $index;
28    
29  my %opts;  my %opts;
# Line 170  sub data2xml { Line 171  sub data2xml {
171                          ($s,$se,$d,$i) = (0,1,0,0);                          ($s,$se,$d,$i) = (0,1,0,0);
172                  } elsif (lc($type) =~ /^lookup/) {                  } elsif (lc($type) =~ /^lookup/) {
173                          ($s,$se,$d,$i,$il) = (0,1,0,0,1);                          ($s,$se,$d,$i,$il) = (0,1,0,0,1);
174                    } elsif ($type) {
175                            print STDERR "WARNING: unknown type: $type\n";
176                  }                  }
177                  return ($s,$se,$d,$i,$il);                  return ($s,$se,$d,$i,$il);
178          }          }
# Line 255  sub data2xml { Line 258  sub data2xml {
258                          # init vars so that we go into while...                          # init vars so that we go into while...
259                          ($swish,$display) = (1,1);                          ($swish,$display) = (1,1);
260    
                         # placeholder for all repeatable entries for index  
   
261                          sub mkformat($$) {                          sub mkformat($$) {
262                                  my $x = shift || die "mkformat needs tag reference";                                  my $x = shift || die "mkformat needs tag reference";
263                                  my $data = shift || return;                                  my $data = shift || return;
# Line 737  print STDERR "using: $type...\n"; Line 738  print STDERR "using: $type...\n";
738                  $import2cp = Text::Iconv->new($config->{isis_codepage},$codepage);                  $import2cp = Text::Iconv->new($config->{isis_codepage},$codepage);
739                  my $db = new Biblio::Isis( isisdb => $isis_db );                  my $db = new Biblio::Isis( isisdb => $isis_db );
740    
741                  my $max_rowid = $db->count || die "can't find maxmfn";                  my $max_rowid = $db->count;
742    
743                    if (! $max_rowid) {
744                            print STDERR "FATAL: can't read ISIS database: $isis_db, skipping...\n";
745                            next;
746                    }
747    
748                  print STDERR "Reading database: $isis_db [$max_rowid rows]\n";                  print STDERR "Reading database: $isis_db [$max_rowid rows]\n";
749    
750                  my $path = $database;                  $path = $database;
751    
752                  for (my $row_id = 1; $row_id <= $max_rowid; $row_id++ ) {                  for (my $row_id = 1; $row_id <= $max_rowid; $row_id++ ) {
753                          my $row = $db->to_hash( $row_id );                          my $row = $db->to_hash( $row_id );
# Line 835  print STDERR "using: $type...\n"; Line 841  print STDERR "using: $type...\n";
841                  warn "marc_format is no longer used!" if ($config->{marc_format});                  warn "marc_format is no longer used!" if ($config->{marc_format});
842                  print STDERR "Reading MARC file '$marc_file'\n";                  print STDERR "Reading MARC file '$marc_file'\n";
843    
844                  my $marc = MARC::File::USMARC->in( $marc_file )                  my $marc = MARC::File::USMARC->in( $marc_file );
845                          || die "Can't open MARC file '$marc_file': ".$MARC::File::ERROR;  
846                    if (! $marc) {
847                            print STDERR "FATAL: can't read MARC file: $marc_file, skipping...\n";
848                            next;
849                    }
850    
851                  # count records in MARC file                  # count records in MARC file
852                  sub marc_count {                  sub marc_count {
853                          my $filename = shift || die;                          my $filename = shift || die;
854                          my $file = MARC::File::USMARC->in($filename) || die $MARC::File::ERROR;                          my $file = MARC::File::USMARC->in($filename) || return;
855                          my $count = 0;                          my $count = 0;
856                          while ($file->skip()) {                          while ($file->skip()) {
857                                  $count++;                                  $count++;
# Line 851  print STDERR "using: $type...\n"; Line 861  print STDERR "using: $type...\n";
861    
862                  my $count = marc_count($marc_file) || warn "no records in '$marc_file'?";                  my $count = marc_count($marc_file) || warn "no records in '$marc_file'?";
863    
864                  my $i = 0;                  my $i = 1;
865    
866                  while( my $rec = $marc->next() ) {                  while( my $rec = $marc->next() ) {
867    
868                          progress($i++,$count);                          progress($i,$count);
869    
870                          my $swishpath = $database."#".$i;                          my $swishpath = $database."#".$i;
871    
# Line 866  print STDERR "using: $type...\n"; Line 876  print STDERR "using: $type...\n";
876                                  print "Content-Length: ".(length($xml)+1)."\n";                                  print "Content-Length: ".(length($xml)+1)."\n";
877                                  print "Document-Type: XML\n\n$xml\n";                                  print "Document-Type: XML\n\n$xml\n";
878                          }                          }
879    
880                            $i++;
881                  }                  }
882    
883                  print STDERR "\n";                  print STDERR "\n";
# Line 930  all2xml.pl - read various file formats a Line 942  all2xml.pl - read various file formats a
942    
943  =head1 DESCRIPTION  =head1 DESCRIPTION
944    
945  This command will read ISIS data file using IsisDB perl module, MARC  This command will read ISIS data file using Biblio::Isis perl module, MARC
946  records using MARC module and optionally Micro$oft Excel files to  records using MARC::File module and optionally Micro$oft Excel files to
947  create one XML file for usage with I<SWISH-E> indexer. Dispite it's name,  create one XML file for usage with I<SWISH-E> indexer. Dispite it's name,
948  this script B<isn't general xml generator> from isis files (isis allready  this script B<isn't general xml generator> from isis files (isis allready
949  has something like that). Output of this script is tailor-made for SWISH-E.  has something like that). Output of this script is tailor-made for SWISH-E.

Legend:
Removed from v.633  
changed lines
  Added in v.652

  ViewVC Help
Powered by ViewVC 1.1.26