Blame
Date:
Tue Aug 30 11:40:44 2022 UTC
Message:
urlencode the mail/thread id reminded by semarie@, thanks!
001
2022-08-24
op
#!/usr/bin/env perl
002
2022-08-29
op
#
003
2022-08-29
op
# mkindex was written by Omar Polo <op@openbsd.org> and is placed in
004
2022-08-29
op
# the public domain. The author hereby disclaims copyright to this
005
2022-08-29
op
# source code.
006
2022-08-24
op
007
2022-08-24
op
use open ":std", ":encoding(UTF-8)";
008
2022-08-24
op
use utf8;
009
2022-08-24
op
use strict;
010
2022-08-24
op
use warnings;
011
2022-08-24
op
use v5.32;
012
2022-08-30
op
use File::Temp qw(tempfile);
013
2022-08-24
op
014
2022-08-25
op
use OpenBSD::Pledge;
015
2022-08-25
op
use OpenBSD::Unveil;
016
2022-08-25
op
017
2022-08-25
op
use lib ".";
018
2022-08-30
op
use GotMArc qw(parse san urlencode initpage endpage index_header thread_header);
019
2022-08-25
op
020
2022-08-24
op
my $outdir = $ENV{'OUTDIR'};
021
2022-08-24
op
die 'Set $OUTDIR' unless defined $outdir;
022
2022-08-24
op
023
2022-08-24
op
my $tfh; # thread file handle
024
2022-08-24
op
my $pfh; # page file handle
025
2022-08-26
op
my $page = 0;
026
2022-08-26
op
my @pages;
027
2022-08-30
op
my @files;
028
2022-08-26
op
my $from_day;
029
2022-08-26
op
my $to_day;
030
2022-08-24
op
my $threads_seen = 0;
031
2022-08-24
op
my $last_level = 0;
032
2022-08-29
op
my $threads = 0;
033
2022-08-29
op
my $threads_per_page = 100;
034
2022-08-24
op
035
2022-08-26
op
sub maxs {
036
2022-08-26
op
my ($a, $b) = @_;
037
2022-08-26
op
return $a unless defined $b;
038
2022-08-26
op
return $a gt $b ? $a : $b;
039
2022-08-26
op
}
040
2022-08-26
op
041
2022-08-26
op
sub mins {
042
2022-08-26
op
my ($a, $b) = @_;
043
2022-08-26
op
return $a unless defined $b;
044
2022-08-26
op
return $a lt $b ? $a : $b;
045
2022-08-26
op
}
046
2022-08-26
op
047
2022-08-24
op
sub pagename {
048
2022-08-24
op
my $i = shift;
049
2022-08-26
op
return $i == 1 && "index.html" || "$i.html";
050
2022-08-24
op
}
051
2022-08-24
op
052
2022-08-26
op
sub endfile {
053
2022-08-26
op
say $pfh '</ul></div>';
054
2022-08-26
op
close($pfh);
055
2022-08-26
op
push @pages, "$from_day - $to_day";
056
2022-08-26
op
}
057
2022-08-26
op
058
2022-08-24
op
sub nextfile {
059
2022-08-26
op
endfile if defined $pfh;
060
2022-08-24
op
$page += 1;
061
2022-08-27
op
062
2022-08-30
op
my $path;
063
2022-08-30
op
($pfh, $path) = tempfile "/tmp/gotmarc.index.XXXXXXXXXX";
064
2022-08-30
op
push @files, $path;
065
2022-08-26
op
say $pfh "<div class='thread'><ul>";
066
2022-08-26
op
}
067
2022-08-24
op
068
2022-08-26
op
sub nav {
069
2022-08-27
op
my ($pfh, $n) = @_;
070
2022-08-27
op
my ($first, $last) = (pagename(1), pagename($page));
071
2022-08-26
op
my ($next, $prev) = (pagename($n+1), pagename($n-1));
072
2022-08-24
op
073
2022-08-27
op
say $pfh "<nav>";
074
2022-08-26
op
say $pfh "<a href='$first'>First</a>" if $n > 2;
075
2022-08-26
op
say $pfh "<a href='$prev'>Prev</a>" if $n > 1;
076
2022-08-26
op
say $pfh "<a href='$next'>Next</a>" if $n < $page;
077
2022-08-26
op
say $pfh "<a href='$last'>Last</a>" if $n < $page - 1;
078
2022-08-26
op
say $pfh "</nav>";
079
2022-08-26
op
}
080
2022-08-26
op
081
2022-08-26
op
sub copyfrom {
082
2022-08-26
op
my ($path, $fh) = @_;
083
2022-08-26
op
084
2022-08-26
op
# there are probably faster ways to do this like File::Copy,
085
2022-08-26
op
# but it bypasses the bufio cache...
086
2022-08-26
op
open(my $pfh, '<', $path) or die "can't open $path: $!";
087
2022-08-30
op
print $fh $_ while <$pfh>;
088
2022-08-24
op
}
089
2022-08-24
op
090
2022-08-27
op
sub renderpages {
091
2022-08-24
op
close($pfh);
092
2022-08-24
op
093
2022-08-26
op
for (my $i = 1; $i <= $page; $i++) {
094
2022-08-27
op
my $name = pagename($i);
095
2022-08-30
op
my $path = shift @files;
096
2022-08-27
op
my $dest = "$outdir/$name";
097
2022-08-24
op
098
2022-08-26
op
open(my $pfh, '>', $dest)
099
2022-08-26
op
or die "can't open $dest for writing: $!";
100
2022-08-24
op
101
2022-08-26
op
my $title = "Game of Trees Mail Archive | page $i";
102
2022-08-26
op
my $subtitle = $pages[$i-1];
103
2022-08-24
op
104
2022-08-27
op
initpage($pfh, $title);
105
2022-08-27
op
index_header $pfh, $i, $subtitle;
106
2022-08-27
op
say $pfh "<main>";
107
2022-08-26
op
108
2022-08-27
op
nav $pfh, $i if $page > 1;
109
2022-08-26
op
copyfrom($path, $pfh);
110
2022-08-27
op
nav $pfh, $i if $page > 1;
111
2022-08-26
op
112
2022-08-24
op
say $pfh "</main>";
113
2022-08-24
op
endpage($pfh);
114
2022-08-26
op
115
2022-08-27
op
close($pfh);
116
2022-08-26
op
unlink $path;
117
2022-08-24
op
}
118
2022-08-24
op
}
119
2022-08-24
op
120
2022-08-27
op
sub endthread {
121
2022-08-27
op
say $tfh "</ul></li>" x $last_level;
122
2022-08-27
op
say $tfh "</ul>\n</div>\n";
123
2022-08-27
op
endpage($tfh);
124
2022-08-27
op
close($tfh);
125
2022-08-27
op
126
2022-08-27
op
$last_level = 0;
127
2022-08-27
op
}
128
2022-08-27
op
129
2022-08-24
op
sub nextthread {
130
2022-08-27
op
endthread if defined $tfh;
131
2022-08-24
op
my ($mid, $subj) = @_;
132
2022-08-24
op
my $dest = "$outdir/thread/$mid.html";
133
2022-08-24
op
open($tfh, '>', $dest) or die "can't open $dest: $!";
134
2022-08-24
op
initpage($tfh, $subj);
135
2022-08-27
op
thread_header $tfh, undef, undef, ["Thread: $subj"];
136
2022-08-27
op
print $tfh "<div class='thread'><ul class='mails'>\n";
137
2022-08-24
op
}
138
2022-08-24
op
139
2022-08-26
op
sub entry {
140
2022-08-26
op
my ($fh, $type, $mid, $date, $from, $subj) = @_;
141
2022-08-30
op
my $encmid = urlencode $mid;
142
2022-08-30
op
143
2022-08-30
op
print $fh "<li id='$encmid' class='mail'>";
144
2022-08-24
op
print $fh "<p class='mail-meta'>";
145
2022-08-24
op
print $fh "<time>$date</time> ";
146
2022-08-24
op
print $fh "<span class='from'>$from</span>";
147
2022-08-24
op
print $fh "<span class='colon'>:</span>";
148
2022-08-24
op
print $fh "</p>";
149
2022-08-24
op
print $fh "<p class='subject'>";
150
2022-08-30
op
print $fh "<a href='/$type/$encmid.html'>$subj</a>";
151
2022-08-24
op
print $fh "</p>";
152
2022-08-24
op
print $fh "</li>\n";
153
2022-08-24
op
}
154
2022-08-24
op
155
2022-08-26
op
sub thread_entry {
156
2022-08-26
op
my ($fh, $mid, $level, $date, $from, $subj) = @_;
157
2022-08-26
op
158
2022-08-26
op
say $fh "</ul>\n</li>" x ($last_level - $level) if $last_level > $level;
159
2022-08-27
op
say $fh "<li>\n<ul>" if $last_level < $level;
160
2022-08-26
op
161
2022-08-26
op
entry $fh, "mail", $mid, $date, $from, $subj;
162
2022-08-24
op
}
163
2022-08-24
op
164
2022-08-25
op
unveil($outdir, "rwc") or die "unveil $outdir: $!";
165
2022-08-27
op
unveil(".", "r") or die "unveil .: $!";
166
2022-08-30
op
167
2022-08-30
op
# can't use tmppath because File::Temp checks wether /tmp exists.
168
2022-08-27
op
unveil("/tmp", "rwc") or die "unveil /tmp: $!";
169
2022-08-25
op
170
2022-08-30
op
# fattr for File::Temp
171
2022-08-30
op
pledge("stdio rpath wpath cpath fattr") or die "pledge: $!";
172
2022-08-25
op
173
2022-08-26
op
nextfile;
174
2022-08-24
op
175
2022-08-24
op
while (<>) {
176
2022-08-26
op
my ($level, $fname, $mid, $date, $from, $subj) = parse;
177
2022-08-24
op
178
2022-08-26
op
if ($level == 0) {
179
2022-08-26
op
nextthread $mid, $subj;
180
2022-08-26
op
181
2022-08-29
op
$threads++;
182
2022-08-29
op
if ($threads > $threads_per_page) {
183
2022-08-26
op
nextfile;
184
2022-08-29
op
$threads = 0;
185
2022-08-26
op
$to_day = undef;
186
2022-08-26
op
$from_day = undef;
187
2022-08-26
op
}
188
2022-08-27
op
189
2022-08-27
op
my $day = $date =~ s/ .*//r;
190
2022-08-27
op
$to_day = mins $day, $to_day;
191
2022-08-27
op
$from_day = maxs $day, $from_day;
192
2022-08-27
op
193
2022-08-26
op
entry $pfh, "thread", $mid, $date, $from, $subj;
194
2022-08-26
op
}
195
2022-08-26
op
196
2022-08-27
op
thread_entry $tfh, $mid, $level, $date, $from, $subj;
197
2022-08-24
op
$last_level = $level;
198
2022-08-24
op
$threads_seen = 1;
199
2022-08-24
op
}
200
2022-08-24
op
201
2022-08-26
op
endfile;
202
2022-08-26
op
endthread if $threads_seen;
203
2022-08-27
op
renderpages;
Omar Polo