/[simile]/links/csv2js.pl

This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!

Diff of /links/csv2js.pl

Parent Directory | Revision Log | View Patch Patch

-revision 1 by dpavlin,
Thu Aug 23 09:46:24 2007 UTC
+revision 7 by dpavlin,
Thu Aug 23 13:27:56 2007 UTC
 Line 7 
 use Text::CSV_XS;
  use Text::CSV::Separator qw(get_separator);
  use Carp qw/confess/;
  use LWP::Simple;
- use Imager;
+ use Number::Bytes::Human qw/format_bytes/;
  use JSON::Syck;
  use Data::Dump qw/dump/;
 Line 52 
 my $split_stats;
  my $multiplier = {
          kb => 1024,
-         mb => 1024 * 1204,
+         mb => 1024 * 1024,
          gb => 1024 * 1024 * 1024,
  };
 Line 72 
 sub clean {
          return shift @out;
  }
+ sub human {
+         my $s = shift;
+         if ( $s =~ m/^\s*(\d+)\s*($multiplier_regex)\s*$/i) {
+                 my ( $v, $m ) = ( $1, lc($2) );
+                 my $factor = $multiplier->{$m};
+                 confess "can't find multiplier $m" unless defined $factor;
+                 my $new = format_bytes( $v * $factor, bs => 1024 );
+                 warn "## [$s] $v * $factor ($m) -> $new\n";
+                 return $new;
+         }
+         return;
+ }
+ sub strip_prefix {
+         my @data = @_;
+         my $prefix = shift @data;
+         my $p;
+         foreach my $d ( @data ) {
+                 my $chomp = length($prefix);
+                 # find end of common string
+                 $chomp-- while(
+                         lc(substr( $prefix, 0, $chomp )) ne lc(substr( $d, 0, $chomp ))
+                         &&
+                         $chomp > 0
+                 );
+                 if ( $chomp == 0 ) {
+                         warn "no common prefix in ",dump( @_ );
+                         return @_;
+                 }
+                 my $prefix = substr( $prefix, 0, $chomp );
+                 $p->{$prefix}++;
+         }
+         warn "prefixes found = ",dump($p);
+         my @sorted = sort { $p->{$b} <=> $p->{$a} } keys %$p;
+         my $strip = shift @sorted || return @_;
+         warn "longest preffix: '$strip'\n";
+         return map { my $v = $_; $v =~ s/^\Q$strip\E//i; $v; } @_;
+ }
  while (<$csv_fh>) {
      $csv_parser->parse($_);
      my @fields = $csv_parser->fields;
-Line 106 
 while (<$csv_fh>) {
+Line 149 
 while (<$csv_fh>) {
                                          $h->{ $l . '_short' } = $v;
                                  }
-                                 if ( $v =~ m/(\d+)\s*($multiplier_regex)/) {
+                                 if ( my $human = human( $v ) ) {
-                                         my $new = $1 * $multiplier_regex->{$2};
+                                         $h->{ $l . '_' . $j . '_human' } = $human;
-                                         warn "## $v -> $new\n";
+                                 } else {
-                                         $v = $new;
+                                         $h->{ $l . '_' . $j } = $v;
                                  }
-                                 $split_stats->{$v}->{$j}++;
+                                 $split_stats->{$v}->{pos}->{$j}++;
                                  $split_stats->{$v}->{sum}++;
                                  push @{ $split_stats->{$v}->{rec}->{$#dump + 1} }, $j;
                          }
-Line 134 
 while (<$csv_fh>) {
+Line 177 
 while (<$csv_fh>) {
          if ( mirror( $url, $img_orig_path ) != RC_NOT_MODIFIED ) {
                  warn "$url -> $img_orig_path\n";
          }
-         system('convert', '-geometry', '320x200', $img_orig_path, $img_thumb_path ) if -e $img_thumb_path;
+         system('convert', '-geometry', '320x200', $img_orig_path, $img_thumb_path ) if ! -e $img_thumb_path;
          $h->{'image-url'} = $img_orig_path;
          $h->{'image-thumb-url'} = $img_thumb_path;
-Line 156 
 foreach my $v ( keys %$split_stats ) {
+Line 199 
 foreach my $v ( keys %$split_stats ) {
          }
  }
- #warn "split_stats = ", dump( $split_stats ), "\n";
+ warn "split_stats = ", dump( $split_stats ), "\n";
+ my @all = map { $_->{label_0} || die "no label_0 for ",dump($_) } @dump;
+ warn "all = ",dump(@all);
+ my @stripped = strip_prefix( @all );
+ $dump[$_]->{label_0} = $stripped[$_] foreach ( 0 .. $#stripped );
  warn "dump = ", dump( @dump ), "\n";

 Legend:



Removed from v.1
 


changed lines


 
Added in v.7
 Legend:



Removed from v.1
 


changed lines


 
Added in v.7
-Removed from v.1
+Added in v.7

	ViewVC Help
Powered by ViewVC 1.1.26