/[BackupPC]/trunk/bin/BackupPC_updatedb
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/bin/BackupPC_updatedb

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 90 by dpavlin, Sun Aug 28 17:42:25 2005 UTC revision 190 by dpavlin, Thu Oct 13 11:43:58 2005 UTC
# Line 11  use Getopt::Std; Line 11  use Getopt::Std;
11  use Time::HiRes qw/time/;  use Time::HiRes qw/time/;
12  use File::Pid;  use File::Pid;
13  use POSIX qw/strftime/;  use POSIX qw/strftime/;
14    use BackupPC::SearchLib;
15    
16  use constant BPC_FTYPE_DIR => 5;  use constant BPC_FTYPE_DIR => 5;
17    use constant EST_CHUNK => 100000;
18    
19  my $debug = 0;  my $debug = 0;
20  $|=1;  $|=1;
# Line 40  my $beenThere = {}; Line 42  my $beenThere = {};
42    
43  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";
44  my $user = $Conf{SearchUser} || '';  my $user = $Conf{SearchUser} || '';
 my $index_path = $Conf{HyperEstraierIndex};  
 $index_path = $TopDir . '/' . $index_path;  
 $index_path =~ s#//#/#g;  
45    
46    my $use_hest = $Conf{HyperEstraierIndex};
47    my ($index_path, $index_node_url) = BackupPC::SearchLib::getHyperEstraier_url($use_hest);
48    
49  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });
50    
51  my %opt;  my %opt;
52    
53  if ( !getopts("cdm:v:i", \%opt ) ) {  if ( !getopts("cdm:v:ij", \%opt ) ) {
54          print STDERR <<EOF;          print STDERR <<EOF;
55  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i]  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i]
56    
# Line 58  Options: Line 59  Options:
59          -d      delete database before import          -d      delete database before import
60          -m num  import just num increments for one host          -m num  import just num increments for one host
61          -v num  set verbosity (debug) level (default $debug)          -v num  set verbosity (debug) level (default $debug)
62          -i      update HyperEstraier full text index          -i      update Hyper Estraier full text index
63            -j      update full text, don't check existing files
64    
65    Option -j is variation on -i. It will allow faster initial creation
66    of full-text index from existing database.
67    
68  EOF  EOF
69          exit 1;          exit 1;
70  }  }
# Line 84  sub curr_time { Line 90  sub curr_time {
90  }  }
91    
92  my $hest_db;  my $hest_db;
93    my $hest_node;
94    
95  sub hest_update {  sub signal {
96            my($sig) = @_;
97          my ($host_id, $share_id, $num) = @_;          if ($hest_db) {
98                    print "\nCaught a SIG$sig--syncing database and shutting down\n";
99          print curr_time," updating HyperEstraier: files";                  $hest_db->sync();
100                    $hest_db->close();
101            }
102            exit(0);
103    }
104    
105          my $t = time();  $SIG{'INT'}  = \&signal;
106    $SIG{'QUIT'} = \&signal;
107    
108          my $where = '';  sub hest_update {
         if ($host_id && $share_id && $num) {  
                 $where = qq{  
                 WHERE  
                         hosts.id = ? AND  
                         shares.id = ? AND  
                         files.backupnum = ?  
                 };  
         }  
109    
110          my $sth = $dbh->prepare(qq{          my ($host_id, $share_id, $num) = @_;
                 SELECT  
                         files.id                        AS fid,  
                         hosts.name                      AS hname,  
                         shares.name                     AS sname,  
                         -- shares.share                 AS sharename,  
                         files.backupnum                 AS backupnum,  
                         -- files.name                   AS filename,  
                         files.path                      AS filepath,  
                         files.date                      AS date,  
                         files.type                      AS type,  
                         files.size                      AS size,  
                         files.shareid                   AS shareid,  
                         backups.date                    AS backup_date  
                 FROM files  
                         INNER JOIN shares       ON files.shareID=shares.ID  
                         INNER JOIN hosts        ON hosts.ID = shares.hostID  
                         INNER JOIN backups      ON backups.num = files.backupNum and backups.hostID = hosts.ID AND backups.shareID = shares.ID  
                 $where  
         });  
111    
112          $sth->execute(@_);          my $skip_check = $opt{j} && print STDERR "Skipping check for existing files -- this should be used only with initital import\n";
         my $results = $sth->rows;  
113    
114          if ($results == 0) {          unless ($use_hest) {
115                  print " no files\n";                  print STDERR "HyperEstraier support not enabled in configuration\n";
116                  return;                  return;
117          }          }
118    
119          my $dot = int($results / 15) || 1;          print curr_time," updating HyperEstraier:";
   
         print " $results ($dot/#)";  
120    
121          sub fmt_date {          my $t = time();
                 my $t = shift || return;  
                 my $iso = BackupPC::Lib::timeStamp($t);  
                 $iso =~ s/\s/T/;  
                 return $iso;  
         }  
   
         my $max = int($results / $dot);  
122    
123          print " index $index_path...";          my $offset = 0;
124          use HyperEstraier;          my $added = 0;
         my $db = HyperEstraier::Database->new();  
125    
126  #       unless ($hest_db) {          print " opening index $use_hest";
127  #               print " open reader";          if ($index_path) {
128  #               $hest_db = HyperEstraier::Database->new();                  $hest_db = HyperEstraier::Database->new();
129  #                  $hest_db->open($TopDir . $index_path, $HyperEstraier::Database::DBWRITER | $HyperEstraier::Database::DBCREAT);
130  #       }                  print " directly";
131            } elsif ($index_node_url) {
132                    $hest_node ||= HyperEstraier::Node->new($index_node_url);
133                    $hest_node->set_auth('admin', 'admin');
134                    print " via node URL";
135            } else {
136                    die "don't know how to use HyperEstraier Index $use_hest";
137            }
138            print " increment is " . EST_CHUNK . " files:";
139    
140            my $results = 0;
141    
142          $db->open($index_path, $HyperEstraier::Database::DBWRITER | $HyperEstraier::Database::DBCREAT);          do {
143    
144          my $added = 0;                  my $where = '';
145                    my @data;
146                    if (defined($host_id) && defined($share_id) && defined($num)) {
147                            $where = qq{
148                            WHERE
149                                    hosts.id = ? AND
150                                    shares.id = ? AND
151                                    files.backupnum = ?
152                            };
153                            @data = ( $host_id, $share_id, $num );
154                    }
155    
156          while (my $row = $sth->fetchrow_hashref()) {                  my $limit = sprintf('LIMIT '.EST_CHUNK.' OFFSET %d', $offset);
157    
158                  my $fid = $row->{'fid'} || die "no fid?";                  my $sth = $dbh->prepare(qq{
159                  my $uri = 'file:///' . $fid;                          SELECT
160                                    files.id                        AS fid,
161                                    hosts.name                      AS hname,
162                                    shares.name                     AS sname,
163                                    -- shares.share                 AS sharename,
164                                    files.backupnum                 AS backupnum,
165                                    -- files.name                   AS filename,
166                                    files.path                      AS filepath,
167                                    files.date                      AS date,
168                                    files.type                      AS type,
169                                    files.size                      AS size,
170                                    files.shareid                   AS shareid,
171                                    backups.date                    AS backup_date
172                            FROM files
173                                    INNER JOIN shares       ON files.shareID=shares.ID
174                                    INNER JOIN hosts        ON hosts.ID = shares.hostID
175                                    INNER JOIN backups      ON backups.num = files.backupNum and backups.hostID = hosts.ID AND backups.shareID = shares.ID
176                            $where
177                            $limit
178                    });
179    
180                    $sth->execute(@data);
181                    $results = $sth->rows;
182    
183                    if ($results == 0) {
184                            print " - no new files\n";
185                            last;
186                    }
187    
188                  my $id = $db->uri_to_id($uri);                  sub fmt_date {
189                  next unless ($id == -1);                          my $t = shift || return;
190                            my $iso = BackupPC::Lib::timeStamp($t);
191                            $iso =~ s/\s/T/;
192                            return $iso;
193                    }
194    
195                  # create a document object                  while (my $row = $sth->fetchrow_hashref()) {
                 my $doc = HyperEstraier::Document->new;  
196    
197                  # add attributes to the document object                          my $fid = $row->{'fid'} || die "no fid?";
198                  $doc->add_attr('@uri', $uri);                          my $uri = 'file:///' . $fid;
199    
200                  foreach my $c (@{ $sth->{NAME} }) {                          unless ($skip_check) {
201                          $doc->add_attr($c, $row->{$c}) if ($row->{$c});                                  my $id = ($hest_db || $hest_node)->uri_to_id($uri);
202                                    next unless ($id == -1);
203                            }
204    
205                            # create a document object
206                            my $doc = HyperEstraier::Document->new;
207    
208                            # add attributes to the document object
209                            $doc->add_attr('@uri', $uri);
210    
211                            foreach my $c (@{ $sth->{NAME} }) {
212                                    $doc->add_attr($c, $row->{$c}) if ($row->{$c});
213                            }
214    
215                            #$doc->add_attr('@cdate', fmt_date($row->{'date'}));
216    
217                            # add the body text to the document object
218                            my $path = $row->{'filepath'};
219                            $doc->add_text($path);
220                            $path =~ s/(.)/$1 /g;
221                            $doc->add_hidden_text($path);
222    
223                            print STDERR $doc->dump_draft,"\n" if ($debug > 1);
224    
225                            # register the document object to the database
226                            if ($hest_db) {
227                                    $hest_db->put_doc($doc, $HyperEstraier::Database::PDCLEAN);
228                            } elsif ($hest_node) {
229                                    $hest_node->put_doc($doc);
230                            } else {
231                                    die "not supported";
232                            }
233                            $added++;
234                  }                  }
235    
236                  #$doc->add_attr('@cdate', fmt_date($row->{'date'}));                  print " $added";
237                    $hest_db->sync() if ($index_path);
238    
239                  # add the body text to the document object                  $offset += EST_CHUNK;
                 my $path = $row->{'filepath'};  
                 $doc->add_text($path);  
                 $path =~ s/(.)/$1 /g;  
                 $doc->add_hidden_text($path);  
   
                 print STDERR $doc->dump_draft,"\n" if ($debug > 1);  
   
                 # register the document object to the database  
                 $db->put_doc($doc, $HyperEstraier::Database::PDCLEAN);  
   
                 $added++;  
                 if ($added % $dot == 0) {  
                         print "$max ";  
                         $max--;  
                 }  
240    
241          }          } while ($results == EST_CHUNK);
242    
243          print "sync $added new files";          if ($index_path) {
244          $db->sync();                  print ", close";
245          print " close";                  $hest_db->close();
246          $db->close();          }
247    
248          my $dur = (time() - $t) || 1;          my $dur = (time() - $t) || 1;
249          printf(" [%.2f/s new %.2f/s dur: %s]\n",          printf(" [%.2f/s dur: %s]\n",
                 ( $results / $dur ),  
250                  ( $added / $dur ),                  ( $added / $dur ),
251                  fmt_time($dur)                  fmt_time($dur)
252          );          );
# Line 216  sub hest_update { Line 256  sub hest_update {
256    
257    
258  ## update index ##  ## update index ##
259  if ($opt{i} || ($index_path && ! -e $index_path)) {  if (($opt{i} || $opt{j} || ($index_path && ! -e $index_path)) && !$opt{c}) {
260          # update all          # update all
261          print "force update of HyperEstraier index ";          print "force update of HyperEstraier index ";
262          print "importing existing data" unless (-e $index_path);          print "importing existing data" unless (-e $index_path);
263          print "by -i flag" if ($opt{i});          print "by -i flag" if ($opt{i});
264            print "by -j flag" if ($opt{j});
265          print "\n";          print "\n";
266          hest_update();          hest_update();
267  }  }
# Line 229  if ($opt{i} || ($index_path && ! -e $ind Line 270  if ($opt{i} || ($index_path && ! -e $ind
270  if ($opt{c}) {  if ($opt{c}) {
271          sub do_index {          sub do_index {
272                  my $index = shift || return;                  my $index = shift || return;
273                  my ($table,$col,$unique) = split(/_/, $index);                  my ($table,$col,$unique) = split(/:/, $index);
274                  $unique ||= '';                  $unique ||= '';
275                  $index =~ s/,/_/g;                  $index =~ s/\W+/_/g;
276                    print "$index on $table($col)" . ( $unique ? "u" : "" ) . " ";
277                  $dbh->do(qq{ create $unique index $index on $table($col) });                  $dbh->do(qq{ create $unique index $index on $table($col) });
278          }          }
279    
280          print "creating tables...\n";          print "creating tables...\n";
281          
282          $dbh->do(qq{          $dbh->do( qq{
283                  create table hosts (                  create table hosts (
284                          ID      SERIAL          PRIMARY KEY,                          ID      SERIAL          PRIMARY KEY,
285                          name    VARCHAR(30)     NOT NULL,                          name    VARCHAR(30)     NOT NULL,
286                          IP      VARCHAR(15)                          IP      VARCHAR(15)
287                  );                              );            
288          });  
                 
         $dbh->do(qq{  
289                  create table shares (                  create table shares (
290                          ID      SERIAL          PRIMARY KEY,                          ID      SERIAL          PRIMARY KEY,
291                          hostID  INTEGER         NOT NULL references hosts(id),                          hostID  INTEGER         NOT NULL references hosts(id),
292                          name    VARCHAR(30)     NOT NULL,                          name    VARCHAR(30)     NOT NULL,
293                          share   VARCHAR(200)    NOT NULL,                          share   VARCHAR(200)    NOT NULL
                         localpath VARCHAR(200)        
294                  );                              );            
295          });  
296                            create table dvds (
297          $dbh->do(qq{                          ID      SERIAL          PRIMARY KEY,
298                            num     INTEGER         NOT NULL,
299                            name    VARCHAR(255)    NOT NULL,
300                            mjesto  VARCHAR(255)
301                    );
302    
303                  create table backups (                  create table backups (
304                            id      serial,
305                          hostID  INTEGER         NOT NULL references hosts(id),                          hostID  INTEGER         NOT NULL references hosts(id),
306                          num     INTEGER         NOT NULL,                          num     INTEGER         NOT NULL,
307                          date    integer         NOT NULL,                          date    integer         NOT NULL,
308                          type    CHAR(4)         not null,                          type    CHAR(4)         not null,
309                          shareID integer         not null references shares(id),                          shareID integer         not null references shares(id),
310                          size    integer         not null,                          size    bigint          not null,
311                          PRIMARY KEY(hostID, num, shareID)                          inc_size bigint         not null default -1,
312                            inc_deleted boolean     default false,
313                            PRIMARY KEY(id)
314                  );                              );            
         });  
315    
316          #do_index('backups_hostid,num_unique');                  create table files (
317                            ID              SERIAL,
318                            shareID         INTEGER NOT NULL references shares(id),
319                            backupNum       INTEGER NOT NULL,
320                            name            VARCHAR(255) NOT NULL,
321                            path            VARCHAR(255) NOT NULL,
322                            date            integer NOT NULL,
323                            type            INTEGER NOT NULL,
324                            size            bigint  NOT NULL,
325                            primary key(id)
326                    );
327    
328          $dbh->do(qq{                  create table archive (
329                  create table dvds (                          id              serial,
330                          ID      SERIAL          PRIMARY KEY,                          dvd_nr          int not null,
331                          num     INTEGER         NOT NULL,                          total_size      bigint default -1,
332                          name    VARCHAR(255)    NOT NULL,                          note            text,
333                          mjesto  VARCHAR(255)                          username        varchar(20) not null,
334                            date            timestamp default now(),
335                            primary key(id)
336                    );      
337    
338                    create table archive_backup (
339                            archive_id      int not null references archive(id) on delete cascade,
340                            backup_id       int not null references backups(id),
341                            primary key(archive_id, backup_id)
342                  );                  );
         });  
343    
344          $dbh->do(qq{                      create table archive_burned (
345                  create table files (                          archive_id int references archive(id),
346                          ID      SERIAL          PRIMARY KEY,                            date date default now(),
347                          shareID INTEGER         NOT NULL references shares(id),                          iso_size int default -1
                         backupNum  INTEGER      NOT NULL,  
                         name       VARCHAR(255) NOT NULL,  
                         path       VARCHAR(255) NOT NULL,  
                         date       integer      NOT NULL,  
                         type       INTEGER      NOT NULL,  
                         size       INTEGER      NOT NULL,  
                         dvdid      INTEGER      references dvds(id)      
348                  );                  );
349    
350          });          });
351    
352          print "creating indexes:";          print "creating indexes: ";
353    
354          foreach my $index (qw(          foreach my $index (qw(
355                  hosts_name                  hosts:name
356                  backups_hostID                  backups:hostID
357                  backups_num                  backups:num
358                  shares_hostID                  backups:shareID
359                  shares_name                  shares:hostID
360                  files_shareID                  shares:name
361                  files_path                  files:shareID
362                  files_name                  files:path
363                  files_date                  files:name
364                  files_size                  files:date
365                    files:size
366                    archive:dvd_nr
367                    archive_burned:archive_id
368          )) {          )) {
                 print " $index";  
369                  do_index($index);                  do_index($index);
370          }          }
371    
372            print " creating sequence: ";
373            foreach my $seq (qw/dvd_nr/) {
374                    print "$seq ";
375                    $dbh->do( qq{ CREATE SEQUENCE $seq } );
376            }
377    
378    
379          print "...\n";          print "...\n";
380    
381          $dbh->commit;          $dbh->commit;
# Line 424  foreach my $host_key (keys %{$hosts}) { Line 491  foreach my $host_key (keys %{$hosts}) {
491                                  $hostID,                                  $hostID,
492                                  $backupNum,                                  $backupNum,
493                                  $backup->{'endTime'},                                  $backup->{'endTime'},
494                                  $backup->{'type'},                                  substr($backup->{'type'},0,4),
495                                  $shareID,                                  $shareID,
496                                  $size,                                  $size,
497                          );                          );
# Line 440  foreach my $host_key (keys %{$hosts}) { Line 507  foreach my $host_key (keys %{$hosts}) {
507                                  fmt_time($dur)                                  fmt_time($dur)
508                          );                          );
509    
510                          hest_update($hostID, $shareID, $backupNum);                          hest_update($hostID, $shareID, $backupNum) if ($nf + $nd > 0);
511                  }                  }
512    
513          }          }
# Line 469  sub getShareID() { Line 536  sub getShareID() {
536    
537          $sth->{insert_share} ||= $dbh->prepare(qq{          $sth->{insert_share} ||= $dbh->prepare(qq{
538                  INSERT INTO shares                  INSERT INTO shares
539                          (hostID,name,share,localpath)                          (hostID,name,share)
540                  VALUES (?,?,?,?)                  VALUES (?,?,?)
541          });          });
542    
543          my $drop_down = $hostname . '/' . $share;          my $drop_down = $hostname . '/' . $share;
544          $drop_down =~ s#//+#/#g;          $drop_down =~ s#//+#/#g;
545    
546          $sth->{insert_share}->execute($hostID,$share, $drop_down ,undef);          $sth->{insert_share}->execute($hostID,$share, $drop_down);
547          return $dbh->last_insert_id(undef,undef,'shares',undef);          return $dbh->last_insert_id(undef,undef,'shares',undef);
548  }  }
549    

Legend:
Removed from v.90  
changed lines
  Added in v.190

  ViewVC Help
Powered by ViewVC 1.1.26