/[BackupPC]/trunk/bin/BackupPC_updatedb
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/bin/BackupPC_updatedb

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 86 by dpavlin, Sun Aug 28 12:35:59 2005 UTC revision 136 by dpavlin, Fri Sep 23 15:04:37 2005 UTC
# Line 11  use Getopt::Std; Line 11  use Getopt::Std;
11  use Time::HiRes qw/time/;  use Time::HiRes qw/time/;
12  use File::Pid;  use File::Pid;
13  use POSIX qw/strftime/;  use POSIX qw/strftime/;
14    use BackupPC::SearchLib;
15    
16  use constant BPC_FTYPE_DIR => 5;  use constant BPC_FTYPE_DIR => 5;
17    use constant EST_CHUNK => 100000;
18    
19  my $debug = 0;  my $debug = 0;
20  $|=1;  $|=1;
# Line 40  my $beenThere = {}; Line 42  my $beenThere = {};
42    
43  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";  my $dsn = $Conf{SearchDSN} || die "Need SearchDSN in config.pl\n";
44  my $user = $Conf{SearchUser} || '';  my $user = $Conf{SearchUser} || '';
45  my $index_path = $Conf{HyperEstraierIndex};  
46    my $use_hest = $Conf{HyperEstraierIndex};
47    my ($index_path, $index_node_url) = BackupPC::SearchLib::getHyperEstraier_url($use_hest);
48    
49  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });  my $dbh = DBI->connect($dsn, $user, "", { RaiseError => 1, AutoCommit => 0 });
50    
51  my %opt;  my %opt;
52    
53  if ( !getopts("cdm:v:i", \%opt ) ) {  if ( !getopts("cdm:v:ij", \%opt ) ) {
54          print STDERR <<EOF;          print STDERR <<EOF;
55  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i]  usage: $0 [-c|-d] [-m num] [-v|-v level] [-i]
56    
# Line 55  Options: Line 59  Options:
59          -d      delete database before import          -d      delete database before import
60          -m num  import just num increments for one host          -m num  import just num increments for one host
61          -v num  set verbosity (debug) level (default $debug)          -v num  set verbosity (debug) level (default $debug)
62          -i      update HyperEstraier full text index          -i      update Hyper Estraier full text index
63            -j      update full text, don't check existing files
64    
65    Option -j is variation on -i. It will allow faster initial creation
66    of full-text index from existing database.
67    
68  EOF  EOF
69          exit 1;          exit 1;
70  }  }
# Line 80  sub curr_time { Line 89  sub curr_time {
89          return strftime($t_fmt,localtime());          return strftime($t_fmt,localtime());
90  }  }
91    
92  #---- /subs ----  my $hest_db;
93    my $hest_node;
94    
95  ## update index ##  sub signal {
96  if ($opt{i}) {          my($sig) = @_;
97            if ($hest_db) {
98                    print "\nCaught a SIG$sig--syncing database and shutting down\n";
99                    $hest_db->sync();
100                    $hest_db->close();
101            }
102            exit(0);
103    }
104    
105          print curr_time," updating HyperEstraier: files";  $SIG{'INT'}  = \&signal;
106    $SIG{'QUIT'} = \&signal;
107    
108          my $t = time();  sub hest_update {
109            
110          my $sth = $dbh->prepare(qq{          my ($host_id, $share_id, $num) = @_;
111                  SELECT  
112                          files.id                        AS fid,          my $skip_check = $opt{j} && print STDERR "Skipping check for existing files -- this should be used only with initital import\n";
113                          hosts.name                      AS hname,  
114                          shares.name                     AS sname,          unless ($use_hest) {
115                          -- shares.share                 AS sharename,                  print STDERR "HyperEstraier support not enabled in configuration\n";
116                          files.backupnum                 AS backupnum,                  return;
                         -- files.name                   AS filename,  
                         files.path                      AS filepath,  
                         files.date                      AS date,  
                         files.type                      AS filetype,  
                         files.size                      AS size,  
                         files.shareid                   AS shareid,  
                         backups.date                    AS backup_date  
                 FROM files  
                         INNER JOIN shares       ON files.shareID=shares.ID  
                         INNER JOIN hosts        ON hosts.ID = shares.hostID  
                         INNER JOIN backups      ON backups.num = files.backupNum and backups.hostID = hosts.ID AND backups.shareID = shares.ID  
         });  
   
         $sth->execute();  
         my $results = $sth->rows;  
   
         my $dot = int($results / 15);  
   
         print " $results ($dot/#)";  
   
         sub fmt_date {  
                 my $t = shift || return;  
                 my $iso = BackupPC::Lib::timeStamp($t);  
                 $iso =~ s/\s/T/;  
                 return $iso;  
117          }          }
118    
119          my $i = 0;          print curr_time," updating HyperEstraier:";
         my $max = int($results / $dot);  
120    
121          $index_path = $TopDir . '/' . $index_path;          my $t = time();
         $index_path =~ s#//#/#g;  
122    
123          print " index $index_path...";          my $offset = 0;
124          use HyperEstraier;          my $added = 0;
         my $db = HyperEstraier::Database->new();  
         $db->open($index_path, $HyperEstraier::Database::DBWRITER | $HyperEstraier::Database::DBCREAT);  
125    
126            print " opening index $use_hest";
127            if ($index_path) {
128                    $hest_db = HyperEstraier::Database->new();
129                    $hest_db->open($TopDir . $index_path, $HyperEstraier::Database::DBWRITER | $HyperEstraier::Database::DBCREAT);
130                    print " directly";
131            } elsif ($index_node_url) {
132                    $hest_node ||= HyperEstraier::Node->new($index_node_url);
133                    $hest_node->set_auth('admin', 'admin');
134                    print " via node URL";
135            } else {
136                    die "don't know how to use HyperEstraier Index $use_hest";
137            }
138            print " increment is " . EST_CHUNK . " files:";
139    
140          while (my $row = $sth->fetchrow_hashref()) {          my $results = 0;
141    
142                  # create a document object          do {
                 my $doc = HyperEstraier::Document->new;  
143    
144                  # add attributes to the document object                  my $where = '';
145                  $doc->add_attr('@uri', 'file:///' . $row->{'fid'});                  my @data;
146                    if ($host_id && $share_id && $num) {
147                            $where = qq{
148                            WHERE
149                                    hosts.id = ? AND
150                                    shares.id = ? AND
151                                    files.backupnum = ?
152                            };
153                            @data = ( $host_id, $share_id, $num );
154                    }
155    
156                    my $limit = sprintf('LIMIT '.EST_CHUNK.' OFFSET %d', $offset);
157    
158                    my $sth = $dbh->prepare(qq{
159                            SELECT
160                                    files.id                        AS fid,
161                                    hosts.name                      AS hname,
162                                    shares.name                     AS sname,
163                                    -- shares.share                 AS sharename,
164                                    files.backupnum                 AS backupnum,
165                                    -- files.name                   AS filename,
166                                    files.path                      AS filepath,
167                                    files.date                      AS date,
168                                    files.type                      AS type,
169                                    files.size                      AS size,
170                                    files.shareid                   AS shareid,
171                                    backups.date                    AS backup_date
172                            FROM files
173                                    INNER JOIN shares       ON files.shareID=shares.ID
174                                    INNER JOIN hosts        ON hosts.ID = shares.hostID
175                                    INNER JOIN backups      ON backups.num = files.backupNum and backups.hostID = hosts.ID AND backups.shareID = shares.ID
176                            $where
177                            $limit
178                    });
179    
180                    $sth->execute(@data);
181                    $results = $sth->rows;
182    
183                    if ($results == 0) {
184                            print " - no new files\n";
185                            last;
186                    }
187    
188                  foreach my $c (@{ $sth->{NAME} }) {                  sub fmt_date {
189                          $doc->add_attr($c, $row->{$c}) if ($row->{$c});                          my $t = shift || return;
190                            my $iso = BackupPC::Lib::timeStamp($t);
191                            $iso =~ s/\s/T/;
192                            return $iso;
193                  }                  }
194    
195                  #$doc->add_attr('@cdate', fmt_date($row->{'date'}));                  while (my $row = $sth->fetchrow_hashref()) {
196    
197                  # add the body text to the document object                          my $fid = $row->{'fid'} || die "no fid?";
198                  my $path = $row->{'filepath'};                          my $uri = 'file:///' . $fid;
199                  $doc->add_text($path);  
200                  $path =~ s/(.)/$1 /g;                          unless ($skip_check) {
201                  $doc->add_hidden_text($path);                                  my $id = ($hest_db || $hest_node)->uri_to_id($uri);
202                                    next unless ($id == -1);
203                  print STDERR $doc->dump_draft,"\n" if ($debug > 1);                          }
204    
205                  # register the document object to the database                          # create a document object
206                  $db->put_doc($doc, $HyperEstraier::Database::PDCLEAN);                          my $doc = HyperEstraier::Document->new;
207    
208                  $i++;                          # add attributes to the document object
209                  if ($i % $dot == 0) {                          $doc->add_attr('@uri', $uri);
210                          print "$max ";  
211                          $max--;                          foreach my $c (@{ $sth->{NAME} }) {
212                                    $doc->add_attr($c, $row->{$c}) if ($row->{$c});
213                            }
214    
215                            #$doc->add_attr('@cdate', fmt_date($row->{'date'}));
216    
217                            # add the body text to the document object
218                            my $path = $row->{'filepath'};
219                            $doc->add_text($path);
220                            $path =~ s/(.)/$1 /g;
221                            $doc->add_hidden_text($path);
222    
223                            print STDERR $doc->dump_draft,"\n" if ($debug > 1);
224    
225                            # register the document object to the database
226                            if ($hest_db) {
227                                    $hest_db->put_doc($doc, $HyperEstraier::Database::PDCLEAN);
228                            } elsif ($hest_node) {
229                                    $hest_node->put_doc($doc);
230                            } else {
231                                    die "not supported";
232                            }
233                            $added++;
234                  }                  }
235    
236          }                  print " $added";
237                    $hest_db->sync() if ($index_path);
238    
239                    $offset += EST_CHUNK;
240    
241          print "sync";          } while ($results == EST_CHUNK);
242          $db->sync();  
243          print " close";          if ($index_path) {
244          $db->close();                  print ", close";
245                    $hest_db->close();
246            }
247    
248          my $dur = (time() - $t) || 1;          my $dur = (time() - $t) || 1;
249          printf(" [%.2f/s dur: %s]\n",          printf(" [%.2f/s dur: %s]\n",
250                  ( $results / $dur ),                  ( $added / $dur ),
251                  fmt_time($dur)                  fmt_time($dur)
252          );          );
   
         exit;  
253  }  }
254    
255  ###################################create tables############################3  #---- /subs ----
256    
257    
258    ## update index ##
259    if (($opt{i} || $opt{j} || ($index_path && ! -e $index_path)) && !$opt{c}) {
260            # update all
261            print "force update of HyperEstraier index ";
262            print "importing existing data" unless (-e $index_path);
263            print "by -i flag" if ($opt{i});
264            print "by -j flag" if ($opt{j});
265            print "\n";
266            hest_update();
267    }
268    
269    ## create tables ##
270  if ($opt{c}) {  if ($opt{c}) {
271          sub do_index {          sub do_index {
272                  my $index = shift || return;                  my $index = shift || return;
# Line 212  if ($opt{c}) { Line 295  if ($opt{c}) {
295                          localpath VARCHAR(200)                                localpath VARCHAR(200)      
296                  );                              );            
297          });          });
298    
299            $dbh->do(qq{
300                    create table dvds (
301                            ID      SERIAL          PRIMARY KEY,
302                            num     INTEGER         NOT NULL,
303                            name    VARCHAR(255)    NOT NULL,
304                            mjesto  VARCHAR(255)
305                    );
306            });
307                    
308          $dbh->do(qq{          $dbh->do(qq{
309                  create table backups (                  create table backups (
# Line 220  if ($opt{c}) { Line 312  if ($opt{c}) {
312                          date    integer         NOT NULL,                          date    integer         NOT NULL,
313                          type    CHAR(4)         not null,                          type    CHAR(4)         not null,
314                          shareID integer         not null references shares(id),                          shareID integer         not null references shares(id),
315                          size    integer         not null,                          size    bigint          not null,
316                          PRIMARY KEY(hostID, num, shareID)                          PRIMARY KEY(hostID, num, shareID)
317                  );                              );            
318          });          });
319    
320          #do_index('backups_hostid,num_unique');          #do_index('backups_hostid,num_unique');
321    
         $dbh->do(qq{  
                 create table dvds (  
                         ID      SERIAL          PRIMARY KEY,  
                         num     INTEGER         NOT NULL,  
                         name    VARCHAR(255)    NOT NULL,  
                         mjesto  VARCHAR(255)  
                 );  
         });  
322    
323          $dbh->do(qq{              $dbh->do(qq{    
324                  create table files (                  create table files (
# Line 245  if ($opt{c}) { Line 329  if ($opt{c}) {
329                          path       VARCHAR(255) NOT NULL,                          path       VARCHAR(255) NOT NULL,
330                          date       integer      NOT NULL,                          date       integer      NOT NULL,
331                          type       INTEGER      NOT NULL,                          type       INTEGER      NOT NULL,
332                          size       INTEGER      NOT NULL,                          size       INTEGER      NOT NULL
                         dvdid      INTEGER      references dvds(id)      
333                  );                  );
334          });          });
335    
336    
337            $dbh->do( qq{
338                    create table archive
339                    (
340                            id                      int not null,
341                            dvd_nr          int not null,
342                            note            text,
343                            username        varchar(20) not null,
344                            date            timestamp,
345                            primary key(id)
346                    );      
347            }
348            );
349    
350            $dbh->do( qq{
351                    create table archive_backup
352                    (
353                            archive_id      int not null,
354                            backup_id       int not null,
355                            status          text,
356                            primary key(archive_id, backup_id)
357                    );
358            });
359    
360            $dbh->do( qq{
361                    create table workflows(
362                            id                      int not null,
363                            step_id         int not null,
364                            start           timestamp,
365                            stop            timestamp,
366                            username        varchar(20),
367                            archive_id      int not null,
368                            running         boolean default true,
369                            primary key(id)
370                    );
371            });
372    
373            $dbh->do( qq{
374                    create table workflow_step
375                    (
376                            step_id         int not null,
377                            code            text,
378                            next_step       int,
379                            stop            boolean default false,
380                            primary key(step_id)
381                    );
382            });
383    
384            $dbh->do( qq{
385                            alter table workflow_step
386                                    add constraint fk_workflow_next_step
387                                    foreign key(next_step)
388                                    references workflow_step(step_id);
389            });
390    
391            $dbh->do( qq{
392                    alter table workflows
393                            add constraint fk_workflows_step_id
394                            foreign key(step_id)
395                            references workflow_step(step_id);
396            });
397            
398            $dbh->do( qq{
399                    alter table workflows
400                            add constraint fk_workflows_archive_id
401                            foreign key(archive_id)
402                            references archive(id);
403            });
404    
405            $dbh->do( qq{
406                    create table workflow_log
407                    (
408                            workflow_id             int not null,
409                            step_id                 int not null,
410                            date                    timestamp not null,
411                            status                  text,
412                            primary key(workflow_id, step_id)
413                    );
414            });
415    
416            $dbh->do( qq{
417                    alter table workflow_log
418                            add constraint fk_workflow_log_workflow_id
419                            foreign key (workflow_id)
420                            references workflows(id);
421                    });
422            
423            $dbh->do( qq{
424                    alter table workflow_log
425                            add constraint fk_workflow_log_step_id
426                            foreign key (step_id)
427                            references      workflow_step(step_id);
428                    });
429    
430          print "creating indexes:";          print "creating indexes:";
431    
432          foreach my $index (qw(          foreach my $index (qw(
# Line 273  if ($opt{c}) { Line 450  if ($opt{c}) {
450    
451  }  }
452    
453    ## delete data before inseting ##
454  if ($opt{d}) {  if ($opt{d}) {
455          print "deleting ";          print "deleting ";
456          foreach my $table (qw(files dvds backups shares hosts)) {          foreach my $table (qw(files dvds backups shares hosts)) {
# Line 284  if ($opt{d}) { Line 462  if ($opt{d}) {
462          $dbh->commit;          $dbh->commit;
463  }  }
464    
465  #################################INSERT VALUES#############################  ## insert new values ##
466    
467  # get hosts  # get hosts
468  $hosts = $bpc->HostInfoRead();  $hosts = $bpc->HostInfoRead();
# Line 381  foreach my $host_key (keys %{$hosts}) { Line 559  foreach my $host_key (keys %{$hosts}) {
559                                  $hostID,                                  $hostID,
560                                  $backupNum,                                  $backupNum,
561                                  $backup->{'endTime'},                                  $backup->{'endTime'},
562                                  $backup->{'type'},                                  substr($backup->{'type'},0,4),
563                                  $shareID,                                  $shareID,
564                                  $size,                                  $size,
565                          );                          );
# Line 396  foreach my $host_key (keys %{$hosts}) { Line 574  foreach my $host_key (keys %{$hosts}) {
574                                  ( ($f+$d) / $dur ),                                  ( ($f+$d) / $dur ),
575                                  fmt_time($dur)                                  fmt_time($dur)
576                          );                          );
577    
578                            hest_update($hostID, $shareID, $backupNum) if ($nf + $nd > 0);
579                  }                  }
580    
581          }          }

Legend:
Removed from v.86  
changed lines
  Added in v.136

  ViewVC Help
Powered by ViewVC 1.1.26