/[swish]/trunk/html/swish.cgi
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/html/swish.cgi

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 8 by dpavlin, Sun Mar 16 21:06:43 2003 UTC revision 57 by dpavlin, Sun Jan 25 16:49:50 2004 UTC
# Line 8  use XML::Simple; Line 8  use XML::Simple;
8  use Lingua::Spelling::Alternative;  use Lingua::Spelling::Alternative;
9  use Text::Iconv;  use Text::Iconv;
10    
 # output charset  
 my $CHARSET='ISO-8859-2';  
   
11  Text::Iconv->raise_error(0);     # Conversion errors raise exceptions  Text::Iconv->raise_error(0);     # Conversion errors raise exceptions
 my $from_utf8 = Text::Iconv->new('UTF8', $CHARSET);  
   
12  my $config=XMLin(undef,  my $config=XMLin(undef,
13  #               keyattr => { label => "value" },  #               keyattr => { label => "value" },
14                  forcecontent => 0,                  forcecontent => 0,
15          );          );
16    
17  use Data::Dumper;  my $from_utf8 = Text::Iconv->new('UTF8', $config->{charset});
18  #print Dumper($config);  sub x {
19            return $from_utf8->convert($_[0]);
20    }
21    
22  my $spelling_alt;  # Escape <, >, & and ", and to produce valid XML
23    my %escape = ('<'=>'&lt;', '>'=>'&gt;', '&'=>'&amp;', '"'=>'&quot;');  
24    my $escape_re  = join '|' => keys %escape;
25    sub e {
26            my $out;
27            foreach my $v (@_) {
28                    $v =~ s/($escape_re)/$escape{$1}/g;
29                    $out .= $v;
30            }
31            return $out;
32    }
33    
34    my @spellings;
35  # FIX: doesn't work very well  # FIX: doesn't work very well
36    if ($config->{findaffix}) {
37            foreach my $findaffix (split(/[, ]+/,x($config->{findaffix}))) {
38                    my $spelling_alt = new Lingua::Spelling::Alternative;
39                    $spelling_alt->load_findaffix($findaffix);
40                    push @spellings,$spelling_alt;
41            }
42    }
43  if ($config->{affix}) {  if ($config->{affix}) {
44          $spelling_alt = new Lingua::Spelling::Alternative;          foreach my $affix (split(/[, ]+/,x($config->{affix}))) {
45          $spelling_alt->load_findaffix($config->{affix});                  my $spelling_alt = new Lingua::Spelling::Alternative;
46                    $spelling_alt->load_affix($affix);
47                    push @spellings,$spelling_alt;
48            }
49  }  }
50    
51  my $hits=0;  my $hits=0;
52  my $max_hits=$config->{max_hits};  my $max_hits=x($config->{max_hits});
53    
54  my %labels;  my %labels;
55  foreach (@{$config->{labels}->{label}}) {  foreach (@{$config->{labels}->{label}}) {
56          $labels{$_->{value}} = $from_utf8->convert($_->{content});          $labels{$_->{value}} = x($_->{content});
57    }
58    
59    my $path = param('path');       # limit to this path
60    my %path_label;
61    my @path_name;
62    foreach (@{$config->{paths}->{path}}) {
63    
64    print STDERR "##: $_->{limit}",x($_->{content}),"\n";
65            push @path_name,x($_->{limit});
66            $path_label{$_->{limit}} = x($_->{content});
67  }  }
68    
69  print header(-charset=>$CHARSET),start_html(-title=>'Pretrazivanje',-lang=>'hr'),start_form;  my @properties = split(/\s+/,x($config->{properties}));
70  print "Potra¾i ",popup_menu(-name=>'max_hits',-values=>[ sort keys %labels ],-labels=>\%labels,-default=>$max_hits)," dokumenata sa riječima: ",textfield('search');  
71  print submit(-value=>'prika¾i');  if ($config->{charset}) {
72  print checkbox(-name=>'no_affix', -checked=>0, -label=>'ne koristi variranje oblika riječi');          print header(-charset=>x($config->{charset}));
73    } else {
74            print header;
75    }
76    print start_html(-title=>x($config->{title})),start_form;
77    print x($config->{text}->{search});
78    print popup_menu(-name=>'max_hits',-values=>[ sort keys %labels ],-labels=>\%labels,-default=>$max_hits);
79    print x($config->{text}->{documents});
80    print textfield('search');
81    print submit(-value=> x($config->{text}->{submit}));
82    print br,checkbox(-name=>'no_affix', -checked=>0, -label=>x($config->{text}->{no_spell})) if (@spellings);
83    print checkbox(-name=>'no_properties', -checked=>0, -label=>($config->{text}->{no_properties})) if (@properties);
84    if (@path_name) {
85            print br,x($config->{text}->{limit});
86            print popup_menu(-name=>'path',-values=>\@path_name,-labels=>\%path_label,-default=>$path);
87    }
88  print end_form,hr;  print end_form,hr;
89    
90  if (param('search')) {  if (param('search')) {
# Line 56  if (param('search')) { Line 100  if (param('search')) {
100          $search =~ s/^\s+//;          $search =~ s/^\s+//;
101          $search =~ s/\s+$//;          $search =~ s/\s+$//;
102    
103            my %words;
104    
105          foreach (split(/\s+/,$search)) {          foreach (split(/\s+/,$search)) {
106                  if (m/^([+-])(\S+)/) {                  if (m/^([+-])(\S+)/) {
107                          $s.= ($s) ? "and " : "";                          $s.= ($s) ? "and " : "";
108                          $s.="not " if ($1 eq "-");                          $s.="not " if ($1 eq "-");
109                          if ($spelling_alt && !param('no_affix')) {                          if (@spellings && !param('no_affix')) {
110                                  my $w = $2; $w =~ s/[\*\s]+//g;                                  my $w = $2; $w =~ s/[\*\s]+//g;
111                                  $w =~ s/^(['"]*)([^'"]+)(['"]*)/$2/;                                  $w =~ s/^(['"]*)([^'"]+)(['"]*)/$2/;
112                                  $s.="$1(".join("* or ",$spelling_alt->alternatives($w))."*)$3 ";                                  my $or="";
113                                    foreach my $spelling_alt (@spellings) {
114                                            $s.="$or$1(".join("* or ",$spelling_alt->alternatives($w))."*)$3 ";
115                                            $or = "or ";
116                                    }
117                          } else {                          } else {
118                                  $s.="$2* ";                                  $s.="$2* ";
119                          }                          }
120                  } else {                  } else {
121                          if ($spelling_alt && !param('no_affix')) {                          if (@spellings && !param('no_affix')) {
122                                  my $w = $_; $w =~ s/[\*\s]+//g;                                  my $w = $_; $w =~ s/[\*\s]+//g;
123                                  #$s.="(".join("* or ",$spelling_alt->alternatives($w))."*) ";                                  #$s.="(".join("* or ",$spelling_alt->alternatives($w))."*) ";
124                                  $s.="(".join("* or ",$spelling_alt->alternatives($w))."*) ";                                  my $or="";
125                                    foreach my $spelling_alt (@spellings) {
126                                            $s.="$or(".join("* or ",$spelling_alt->alternatives($w))."*) ";
127                                            $or = "or ";
128                                    }
129                          } else {                          } else {
130                                  $s.="$_* ";                                  $s.="$_* ";
131                          }                          }
# Line 83  if (param('search')) { Line 137  if (param('search')) {
137          $s=~tr/¹©šŠčČęĘ¾®/sSdDcCcCzZ/;          $s=~tr/¹©šŠčČęĘ¾®/sSdDcCcCzZ/;
138          $s=~s/\*\*+/*/g;          $s=~s/\*\*+/*/g;
139    
140            # limit to some path
141            $s = "swishdocpath=(\"*$path*\") and $s" if ($path);
142    
143            my %params;     # optional parametars for swish
144    
145            # default format for output
146            my $hit_fmt = "<a href=\"%s\">%s</a> [%s]<br>\n";
147    
148            if (@properties) {
149                    $hit_fmt = x($config->{hit}) if (! param('no_properties'));
150                    $params{properties} = \@properties;
151            } else {
152                    $hit_fmt = x($config->{hit}) if (x($config->{hit}));
153            }
154    
155            sub kill_html {
156                    my @out;
157                    foreach (@_) {
158                            s/<[^>]+>//g;
159                            push @out,$_;
160                    }
161                    return @out;
162            }
163    
164          my $sh = SWISH->connect('Fork',          my $sh = SWISH->connect('Fork',
165                  prog     => $config->{prog},                  prog     => x($config->{prog}),
166                  indexes  => $config->{index},                  indexes  => x($config->{index}),
 #               properties  => [qw/god br nr/],  
167                  results  => sub {                  results  => sub {
168                          my ($sh,$hit) = @_;                          my ($sh,$hit) = @_;
169    
170                          print "<a href=\"",$hit->swishdocpath,"\">",$hit->swishtitle,"</a> [",$hit->swishrank,"]<br>\n";                          if ($config->{url}) {
171                                    printf ($hit_fmt ,"http://".virtual_host().x($config->{url}).$hit->swishdocpath,e($hit->swishtitle) || 'untitled',$hit->swishrank, map($hit->$_, @properties));
172                            } else {
173                                    printf ($hit_fmt ,$hit->swishdocpath,e($hit->swishtitle) || 'untitled',$hit->swishrank, map($hit->$_, @properties) );
174    
175                            }
176    
177  #                       print $_[1]->as_string,"<br>\n";  #                       print $_[1]->as_string,"<br>\n";
178  #                       my @fields = $hit->field_names;  #                       my @fields = $hit->field_names;
179  #                       print "Field '$_' = '", $hit->$_, "'<br>\n" for sort @fields;  #                       print "Field '$_' = '", $hit->$_, "'<br>\n" for sort @fields;
180                  },                  },
181                  maxhits => param('max_hits') || $max_hits,                  maxhits => param('max_hits') || $max_hits,
182                    \%params,
183          );          );
184    
185          die $SWISH::errstr unless $sh;          die $SWISH::errstr unless $sh;
# Line 104  if (param('search')) { Line 187  if (param('search')) {
187    
188          $hits = $sh->query($s);          $hits = $sh->query($s);
189    
190          if ($hits > 0) {          if ($hits && $hits > 0) {
191                  print p,hr,"Prikazujem $hits dokumenata (maks. ",param('max_hits') || $max_hits,")... <small>($s)</small>";                  print p,hr;
192                    printf (x($config->{text}->{hits}),$hits,param('max_hits') || $max_hits,$s);
193          } else {          } else {
194                  print p,"Nije našen niti jedan dokument... <small>($s, ",$sh->errstr,")</small>";                  print p;
195                    printf (x($config->{text}->{no_hits}),$s,$sh->errstr);
196          }          }
197  } else {  } else {
198          print p('Kod pretra¾ivanja pretra¾ivač pronalazi sve dokumente u kojima se pojavljuju <b>sve upisanje riječi</b>.',br,'Ako ispred riječi upi¹ete minus (-) neęe se prikazivati dokumenti koji imaju takvu riječ. Npr. <tt>+mreza -novak</tt>');          print p(x($config->{text}->{footer}));
199  }  }

Legend:
Removed from v.8  
changed lines
  Added in v.57

  ViewVC Help
Powered by ViewVC 1.1.26