/[BackupPC]/trunk/bin/BackupPC_updatedb
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/bin/BackupPC_updatedb

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 199 by dpavlin, Thu Oct 13 21:19:06 2005 UTC revision 311 by dpavlin, Sun Jan 29 14:54:17 2006 UTC
# Line 12  use Time::HiRes qw/time/; Line 12  use Time::HiRes qw/time/;
12  use File::Pid;  use File::Pid;
13  use POSIX qw/strftime/;  use POSIX qw/strftime/;
14  use BackupPC::SearchLib;  use BackupPC::SearchLib;
15    use Cwd qw/abs_path/;
16    
17  use constant BPC_FTYPE_DIR => 5;  use constant BPC_FTYPE_DIR => 5;
18  use constant EST_CHUNK => 100000;  use constant EST_CHUNK => 100000;
19    
20    # daylight saving time change offset for 1h
21    my $dst_offset = 60 * 60;
22    
23  my $debug = 0;  my $debug = 0;
24  $|=1;  $|=1;
25    
26  my $start_t = time();  my $start_t = time();
27    
28  my $pidfile = new File::Pid;  my $pid_path = abs_path($0);
29    $pid_path =~ s/\W+/_/g;
30    
31    my $pidfile = new File::Pid({
32            file => "/tmp/$pid_path",
33    });
34    
35  if (my $pid = $pidfile->running ) {  if (my $pid = $pidfile->running ) {
36          die "$0 already running: $pid\n";          die "$0 already running: $pid\n";
# Line 29  if (my $pid = $pidfile->running ) { Line 38  if (my $pid = $pidfile->running ) {
38          $pidfile->remove;          $pidfile->remove;
39          $pidfile = new File::Pid;          $pidfile = new File::Pid;
40  }  }
 $pidfile->write;  
41  print STDERR "$0 using pid ",$pidfile->pid," file ",$pidfile->file,"\n";  print STDERR "$0 using pid ",$pidfile->pid," file ",$pidfile->file,"\n";
42    $pidfile->write;
43    
44  my $t_fmt = '%Y-%m-%d %H:%M:%S';  my $t_fmt = '%Y-%m-%d %H:%M:%S';
45    
# Line 43  my $beenThere = {}; Line 52  my $beenThere = {};
52  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";
53  my $user = $Conf{SearchUser} || '';  my $user = $Conf{SearchUser} || '';
54    
55  my $use_hest = $Conf{HyperEstraierIndex};  my $index_node_url = $Conf{HyperEstraierIndex};
 my ($index_path, $index_node_url) = BackupPC::SearchLib::getHyperEstraier_url($use_hest);  
56    
57  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });
58    
59  my %opt;  my %opt;
60    
61  if ( !getopts("cdm:v:ij", \%opt ) ) {  if ( !getopts("cdm:v:ijfq", \%opt ) ) {
62          print STDERR <<EOF;          print STDERR <<EOF;
63  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i]  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i|-j|-f]
64    
65  Options:  Options:
66          -c      create database on first use          -c      create database on first use
# Line 61  Options: Line 69  Options:
69          -v num  set verbosity (debug) level (default $debug)          -v num  set verbosity (debug) level (default $debug)
70          -i      update Hyper Estraier full text index          -i      update Hyper Estraier full text index
71          -j      update full text, don't check existing files          -j      update full text, don't check existing files
72            -f      don't do anything with full text index
73            -q      be quiet for hosts without changes
74    
75  Option -j is variation on -i. It will allow faster initial creation  Option -j is variation on -i. It will allow faster initial creation
76  of full-text index from existing database.  of full-text index from existing database.
77    
78    Option -f will create database which is out of sync with full text index. You
79    will have to re-run $0 with -i to fix it.
80    
81  EOF  EOF
82          exit 1;          exit 1;
83  }  }
# Line 72  EOF Line 85  EOF
85  if ($opt{v}) {  if ($opt{v}) {
86          print "Debug level at $opt{v}\n";          print "Debug level at $opt{v}\n";
87          $debug = $opt{v};          $debug = $opt{v};
88    } elsif ($opt{f}) {
89            print "WARNING: disabling full-text index update. You need to re-run $0 -j !\n";
90            $index_node_url = undef;
91  }  }
92    
93  #---- subs ----  #---- subs ----
# Line 89  sub curr_time { Line 105  sub curr_time {
105          return strftime($t_fmt,localtime());          return strftime($t_fmt,localtime());
106  }  }
107    
 my $hest_db;  
108  my $hest_node;  my $hest_node;
109    
 sub signal {  
         my($sig) = @_;  
         if ($hest_db) {  
                 print "\nCaught a SIG$sig--syncing database and shutting down\n";  
                 $hest_db->sync();  
                 $hest_db->close();  
         }  
         exit(0);  
 }  
   
 $SIG{'INT'}  = \&signal;  
 $SIG{'QUIT'} = \&signal;  
   
110  sub hest_update {  sub hest_update {
111    
112          my ($host_id, $share_id, $num) = @_;          my ($host_id, $share_id, $num) = @_;
113    
114          my $skip_check = $opt{j} && print STDERR "Skipping check for existing files -- this should be used only with initital import\n";          my $skip_check = $opt{j} && print STDERR "Skipping check for existing files -- this should be used only with initital import\n";
115    
116          unless ($use_hest) {          unless (defined($index_node_url)) {
117                  print STDERR "HyperEstraier support not enabled in configuration\n";                  print STDERR "HyperEstraier support not enabled in configuration\n";
118                    $index_node_url = 0;
119                  return;                  return;
120          }          }
121    
122          print curr_time," updating HyperEstraier:";          print curr_time," updating Hyper Estraier:";
123    
124          my $t = time();          my $t = time();
125    
126          my $offset = 0;          my $offset = 0;
127          my $added = 0;          my $added = 0;
128    
129          print " opening index $use_hest";          print " opening index $index_node_url";
130          if ($index_path) {          if ($index_node_url) {
131                  $hest_db = HyperEstraier::Database->new();                  $hest_node ||= Search::Estraier::Node->new(
132                  $hest_db->open($TopDir . $index_path, $HyperEstraier::Database::DBWRITER | $HyperEstraier::Database::DBCREAT);                          url => $index_node_url,
133                  print " directly";                          user => 'admin',
134          } elsif ($index_node_url) {                          passwd => 'admin',
135                  $hest_node ||= HyperEstraier::Node->new($index_node_url);                          croak_on_error => 1,
136                  $hest_node->set_auth('admin', 'admin');                  );
137                  print " via node URL";                  print " via node URL";
138          } else {          } else {
139                  die "don't know how to use HyperEstraier Index $use_hest";                  die "don't know how to use Hyper Estraier Index $index_node_url";
140          }          }
         print " increment is " . EST_CHUNK . " files:";  
141    
142          my $results = 0;          my $results = 0;
143    
# Line 182  sub hest_update { Line 184  sub hest_update {
184    
185                  if ($results == 0) {                  if ($results == 0) {
186                          print " - no new files\n";                          print " - no new files\n";
187                          last;                          return;
188                    } else {
189                            print " - $results files: ";
190                  }                  }
191    
192                  sub fmt_date {                  sub fmt_date {
# Line 198  sub hest_update { Line 202  sub hest_update {
202                          my $uri = 'file:///' . $fid;                          my $uri = 'file:///' . $fid;
203    
204                          unless ($skip_check) {                          unless ($skip_check) {
205                                  my $id = ($hest_db || $hest_node)->uri_to_id($uri);                                  my $id = $hest_node->uri_to_id($uri);
206                                  next unless ($id == -1);                                  next if ($id && $id == -1);
207                          }                          }
208    
209                          # create a document object                          # create a document object
210                          my $doc = HyperEstraier::Document->new;                          my $doc = Search::Estraier::Document->new;
211    
212                          # add attributes to the document object                          # add attributes to the document object
213                          $doc->add_attr('@uri', $uri);                          $doc->add_attr('@uri', $uri);
214    
215                          foreach my $c (@{ $sth->{NAME} }) {                          foreach my $c (@{ $sth->{NAME} }) {
216                                  $doc->add_attr($c, $row->{$c}) if ($row->{$c});                                  print STDERR "attr $c = $row->{$c}\n" if ($debug > 2);
217                                    $doc->add_attr($c, $row->{$c}) if (defined($row->{$c}));
218                          }                          }
219    
220                          #$doc->add_attr('@cdate', fmt_date($row->{'date'}));                          #$doc->add_attr('@cdate', fmt_date($row->{'date'}));
# Line 223  sub hest_update { Line 228  sub hest_update {
228                          print STDERR $doc->dump_draft,"\n" if ($debug > 1);                          print STDERR $doc->dump_draft,"\n" if ($debug > 1);
229    
230                          # register the document object to the database                          # register the document object to the database
231                          if ($hest_db) {                          if ($hest_node) {
                                 $hest_db->put_doc($doc, $HyperEstraier::Database::PDCLEAN);  
                         } elsif ($hest_node) {  
232                                  $hest_node->put_doc($doc);                                  $hest_node->put_doc($doc);
233                          } else {                          } else {
234                                  die "not supported";                                  die "not supported";
# Line 234  sub hest_update { Line 237  sub hest_update {
237                  }                  }
238    
239                  print " $added";                  print " $added";
                 $hest_db->sync() if ($index_path);  
240    
241                  $offset += EST_CHUNK;                  $offset += EST_CHUNK;
242    
243          } while ($results == EST_CHUNK);          } while ($results == EST_CHUNK);
244    
         if ($index_path) {  
                 print ", close";  
                 $hest_db->close();  
         }  
   
245          my $dur = (time() - $t) || 1;          my $dur = (time() - $t) || 1;
246          printf(" [%.2f/s dur: %s]\n",          printf(" [%.2f/s dur: %s]\n",
247                  ( $added / $dur ),                  ( $added / $dur ),
# Line 256  sub hest_update { Line 253  sub hest_update {
253    
254    
255  ## update index ##  ## update index ##
256  if (($opt{i} || $opt{j} || ($index_path && ! -e $index_path)) && !$opt{c}) {  if ( ( $opt{i} || $opt{j} ) && !$opt{c} ) {
257          # update all          # update all
258          print "force update of HyperEstraier index ";          print "force update of Hyper Estraier index ";
         print "importing existing data" unless (-e $index_path);  
259          print "by -i flag" if ($opt{i});          print "by -i flag" if ($opt{i});
260          print "by -j flag" if ($opt{j});          print "by -j flag" if ($opt{j});
261          print "\n";          print "\n";
# Line 344  if ($opt{c}) { Line 340  if ($opt{c}) {
340    
341                  create table archive_burned (                  create table archive_burned (
342                          archive_id      int references archive(id),                          archive_id      int references archive(id),
343                          date            date default now(),                          date            timestamp default now(),
344                          part            int not null default 1,                          part            int not null default 1,
345                            copy            int not null default 1,
346                          iso_size bigint default -1                          iso_size bigint default -1
347                  );                  );
348    
349                    create table backup_parts (
350                            id serial,
351                            backup_id int references backups(id),
352                            part_nr int not null check (part_nr > 0),
353                            tar_size bigint not null check (tar_size > 0),
354                            size bigint not null check (size > 0),
355                            md5 text not null,
356                            items int not null check (items > 0),
357                            date timestamp default now(),
358                            primary key(id)
359                    );
360          });          });
361    
362          print "creating indexes: ";          print "creating indexes: ";
# Line 367  if ($opt{c}) { Line 375  if ($opt{c}) {
375                  files:size                  files:size
376                  archive:dvd_nr                  archive:dvd_nr
377                  archive_burned:archive_id                  archive_burned:archive_id
378                    backup_parts:backup_id,part_nr
379          )) {          )) {
380                  do_index($index);                  do_index($index);
381          }          }
# Line 421  WHERE hostID=? AND num=? AND shareid=? Line 430  WHERE hostID=? AND num=? AND shareid=?
430    
431  $sth->{insert_backups} = $dbh->prepare(qq{  $sth->{insert_backups} = $dbh->prepare(qq{
432  INSERT INTO backups (hostID, num, date, type, shareid, size)  INSERT INTO backups (hostID, num, date, type, shareid, size)
433  VALUES (?,?,?,?,?,?)  VALUES (?,?,?,?,?,-1)
434    });
435    
436    $sth->{update_backups_size} = $dbh->prepare(qq{
437    UPDATE backups SET size = ?
438    WHERE hostID = ? and num = ? and date = ? and type =? and shareid = ?
439  });  });
440    
441  $sth->{insert_files} = $dbh->prepare(qq{  $sth->{insert_files} = $dbh->prepare(qq{
# Line 430  INSERT INTO files Line 444  INSERT INTO files
444          VALUES (?,?,?,?,?,?,?)          VALUES (?,?,?,?,?,?,?)
445  });  });
446    
447  foreach my $host_key (keys %{$hosts}) {  my @hosts = keys %{$hosts};
448    my $host_nr = 0;
449    
450    foreach my $host_key (@hosts) {
451    
452          my $hostname = $hosts->{$host_key}->{'host'} || die "can't find host for $host_key";          my $hostname = $hosts->{$host_key}->{'host'} || die "can't find host for $host_key";
453    
# Line 445  foreach my $host_key (keys %{$hosts}) { Line 462  foreach my $host_key (keys %{$hosts}) {
462                  $hostID = $dbh->last_insert_id(undef,undef,'hosts',undef);                  $hostID = $dbh->last_insert_id(undef,undef,'hosts',undef);
463          }          }
464    
465          print "host ".$hosts->{$host_key}->{'host'}.": ";          $host_nr++;
   
466          # get backups for a host          # get backups for a host
467          my @backups = $bpc->BackupInfoRead($hostname);          my @backups = $bpc->BackupInfoRead($hostname);
468          my $incs = scalar @backups;          my $incs = scalar @backups;
         print  "$incs increments\n";  
469    
470            my $host_header = sprintf("host %s [%d/%d]: %d increments\n",
471                    $hosts->{$host_key}->{'host'},
472                    $host_nr,
473                    ($#hosts + 1),
474                    $incs
475            );
476            print $host_header unless ($opt{q});
477    
478          my $inc_nr = 0;          my $inc_nr = 0;
479          $beenThere = {};          $beenThere = {};
480    
# Line 463  foreach my $host_key (keys %{$hosts}) { Line 486  foreach my $host_key (keys %{$hosts}) {
486                  my $backupNum = $backup->{'num'};                  my $backupNum = $backup->{'num'};
487                  my @backupShares = ();                  my @backupShares = ();
488    
489                  printf("%-10s %2d/%-2d #%-2d %s %5s/%5s files (date: %s dur: %s)\n",                  my $share_header = sprintf("%-10s %2d/%-2d #%-2d %s %5s/%5s files (date: %s dur: %s)\n",
490                          $hosts->{$host_key}->{'host'},                          $hosts->{$host_key}->{'host'},
491                          $inc_nr, $incs, $backupNum,                          $inc_nr, $incs, $backupNum,
492                          $backup->{type} || '?',                          $backup->{type} || '?',
# Line 471  foreach my $host_key (keys %{$hosts}) { Line 494  foreach my $host_key (keys %{$hosts}) {
494                          strftime($t_fmt,localtime($backup->{startTime})),                          strftime($t_fmt,localtime($backup->{startTime})),
495                          fmt_time($backup->{endTime} - $backup->{startTime})                          fmt_time($backup->{endTime} - $backup->{startTime})
496                  );                  );
497                    print $share_header unless ($opt{q});
498    
499                  my $files = BackupPC::View->new($bpc, $hostname, \@backups, 1);                  my $files = BackupPC::View->new($bpc, $hostname, \@backups, 1);
500                  foreach my $share ($files->shareList($backupNum)) {                  foreach my $share ($files->shareList($backupNum)) {
# Line 484  foreach my $host_key (keys %{$hosts}) { Line 508  foreach my $host_key (keys %{$hosts}) {
508                          # skip if allready in database!                          # skip if allready in database!
509                          next if ($count > 0);                          next if ($count > 0);
510    
511                            # dump host and share header for -q
512                            if ($opt{q}) {
513                                    if ($host_header) {
514                                            print $host_header;
515                                            $host_header = undef;
516                                    }
517                                    print $share_header;
518                            }
519    
520                          # dump some log                          # dump some log
521                          print curr_time," ", $share;                          print curr_time," ", $share;
522    
                         my ($f, $nf, $d, $nd, $size) = recurseDir($bpc, $hostname, $files, $backupNum, $share, "", $shareID);  
   
523                          $sth->{insert_backups}->execute(                          $sth->{insert_backups}->execute(
524                                  $hostID,                                  $hostID,
525                                  $backupNum,                                  $backupNum,
526                                  $backup->{'endTime'},                                  $backup->{'endTime'},
527                                  substr($backup->{'type'},0,4),                                  substr($backup->{'type'},0,4),
528                                  $shareID,                                  $shareID,
                                 $size,  
529                          );                          );
530    
531                          print " commit";                          my ($f, $nf, $d, $nd, $size) = recurseDir($bpc, $hostname, $files, $backupNum, $share, "", $shareID);
532                          $dbh->commit();  
533                            eval {
534                                    $sth->{update_backups_size}->execute(
535                                            $size,
536                                            $hostID,
537                                            $backupNum,
538                                            $backup->{'endTime'},
539                                            substr($backup->{'type'},0,4),
540                                            $shareID,
541                                    );
542                                    print " commit";
543                                    $dbh->commit();
544                            };
545                            if ($@) {
546                                    print " rollback";
547                                    $dbh->rollback();
548                            }
549    
550                          my $dur = (time() - $t) || 1;                          my $dur = (time() - $t) || 1;
551                          printf(" %d/%d files %d/%d dirs %0.2f MB [%.2f/s dur: %s]\n",                          printf(" %d/%d files %d/%d dirs %0.2f MB [%.2f/s dur: %s]\n",
# Line 562  sub found_in_db { Line 608  sub found_in_db {
608                  SELECT 1 FROM files                  SELECT 1 FROM files
609                  WHERE shareID = ? and                  WHERE shareID = ? and
610                          path = ? and                          path = ? and
611                          date = ? and                          size = ? and
612                          size = ?                          ( date = ? or date = ? or date = ? )
613                  LIMIT 1                  LIMIT 1
614          });          });
615    
616          my @param = ($shareID,$path,$date,$size);          my @param = ($shareID,$path,$size,$date, $date-$dst_offset, $date+$dst_offset);
617          $sth->{file_in_db}->execute(@param);          $sth->{file_in_db}->execute(@param);
618          my $rows = $sth->{file_in_db}->rows;          my $rows = $sth->{file_in_db}->rows;
619          print STDERR "## found_in_db($shareID,$path,$date,$size) ",( $rows ? '+' : '-' ), join(" ",@param), "\n" if ($debug >= 3);          print STDERR "## found_in_db($shareID,$path,$date,$size) ",( $rows ? '+' : '-' ), join(" ",@param), "\n" if ($debug >= 3);
# Line 617  sub recurseDir($$$$$$$$) { Line 663  sub recurseDir($$$$$$$$) {
663                                  $filesInBackup->{$path_key}->{'size'}                                  $filesInBackup->{$path_key}->{'size'}
664                          ));                          ));
665    
666                            my $key_dst_prev = join(" ", (
667                                    $shareID,
668                                    $dir,
669                                    $path_key,
670                                    $filesInBackup->{$path_key}->{'mtime'} - $dst_offset,
671                                    $filesInBackup->{$path_key}->{'size'}
672                            ));
673    
674                            my $key_dst_next = join(" ", (
675                                    $shareID,
676                                    $dir,
677                                    $path_key,
678                                    $filesInBackup->{$path_key}->{'mtime'} + $dst_offset,
679                                    $filesInBackup->{$path_key}->{'size'}
680                            ));
681    
682                          my $found;                          my $found;
683                          if (! defined($beenThere->{$key}) && ! ($found = found_in_db($key, @data)) ) {                          if (
684                                    ! defined($beenThere->{$key}) &&
685                                    ! defined($beenThere->{$key_dst_prev}) &&
686                                    ! defined($beenThere->{$key_dst_next}) &&
687                                    ! ($found = found_in_db($key, @data))
688                            ) {
689                                  print STDERR "# key: $key [", $beenThere->{$key},"]" if ($debug >= 2);                                  print STDERR "# key: $key [", $beenThere->{$key},"]" if ($debug >= 2);
690    
691                                  if ($filesInBackup->{$path_key}->{'type'} == BPC_FTYPE_DIR) {                                  if ($filesInBackup->{$path_key}->{'type'} == BPC_FTYPE_DIR) {

Legend:
Removed from v.199  
changed lines
  Added in v.311

  ViewVC Help
Powered by ViewVC 1.1.26