Blame


1 7d6d378a 2022-08-24 op #!/usr/bin/env perl
2 1bcb9899 2022-08-29 op #
3 1bcb9899 2022-08-29 op # mkindex was written by Omar Polo <op@openbsd.org> and is placed in
4 1bcb9899 2022-08-29 op # the public domain. The author hereby disclaims copyright to this
5 1bcb9899 2022-08-29 op # source code.
6 7d6d378a 2022-08-24 op
7 7d6d378a 2022-08-24 op use open ":std", ":encoding(UTF-8)";
8 7d6d378a 2022-08-24 op use utf8;
9 7d6d378a 2022-08-24 op use strict;
10 7d6d378a 2022-08-24 op use warnings;
11 7d6d378a 2022-08-24 op use v5.32;
12 270695a3 2022-08-30 op use File::Temp qw(tempfile);
13 7d6d378a 2022-08-24 op
14 054f3fd4 2022-08-25 op use OpenBSD::Pledge;
15 054f3fd4 2022-08-25 op use OpenBSD::Unveil;
16 054f3fd4 2022-08-25 op
17 04eab9af 2022-08-25 op use lib ".";
18 f0fb0f08 2022-08-30 op use GotMArc qw(parse san urlencode initpage endpage index_header thread_header);
19 04eab9af 2022-08-25 op
20 7d6d378a 2022-08-24 op my $outdir = $ENV{'OUTDIR'};
21 7d6d378a 2022-08-24 op die 'Set $OUTDIR' unless defined $outdir;
22 7d6d378a 2022-08-24 op
23 28ebc168 2022-08-24 op my $tfh; # thread file handle
24 28ebc168 2022-08-24 op my $pfh; # page file handle
25 1913b2fb 2022-08-26 op my $page = 0;
26 d40f4fe2 2022-08-26 op my @pages;
27 270695a3 2022-08-30 op my @files;
28 d40f4fe2 2022-08-26 op my $from_day;
29 d40f4fe2 2022-08-26 op my $to_day;
30 584d65d8 2022-08-24 op my $threads_seen = 0;
31 debcbab2 2022-09-13 op
32 584d65d8 2022-08-24 op my $last_level = 0;
33 debcbab2 2022-09-13 op my $last_tid;
34 debcbab2 2022-09-13 op my $last_date;
35 debcbab2 2022-09-13 op my $last_from;
36 debcbab2 2022-09-13 op my $last_subj;
37 debcbab2 2022-09-13 op
38 c5dff871 2022-08-29 op my $threads = 0;
39 c5dff871 2022-08-29 op my $threads_per_page = 100;
40 7d6d378a 2022-08-24 op
41 d40f4fe2 2022-08-26 op sub maxs {
42 d40f4fe2 2022-08-26 op my ($a, $b) = @_;
43 d40f4fe2 2022-08-26 op return $a unless defined $b;
44 d40f4fe2 2022-08-26 op return $a gt $b ? $a : $b;
45 d40f4fe2 2022-08-26 op }
46 d40f4fe2 2022-08-26 op
47 d40f4fe2 2022-08-26 op sub mins {
48 d40f4fe2 2022-08-26 op my ($a, $b) = @_;
49 d40f4fe2 2022-08-26 op return $a unless defined $b;
50 d40f4fe2 2022-08-26 op return $a lt $b ? $a : $b;
51 d40f4fe2 2022-08-26 op }
52 d40f4fe2 2022-08-26 op
53 28ebc168 2022-08-24 op sub pagename {
54 28ebc168 2022-08-24 op my $i = shift;
55 1913b2fb 2022-08-26 op return $i == 1 && "index.html" || "$i.html";
56 28ebc168 2022-08-24 op }
57 28ebc168 2022-08-24 op
58 ebad21b1 2022-08-26 op sub endfile {
59 ebad21b1 2022-08-26 op say $pfh '</ul></div>';
60 ebad21b1 2022-08-26 op close($pfh);
61 d40f4fe2 2022-08-26 op push @pages, "$from_day - $to_day";
62 ebad21b1 2022-08-26 op }
63 ebad21b1 2022-08-26 op
64 28ebc168 2022-08-24 op sub nextfile {
65 ebad21b1 2022-08-26 op endfile if defined $pfh;
66 28ebc168 2022-08-24 op $page += 1;
67 66e1cf97 2022-08-27 op
68 270695a3 2022-08-30 op my $path;
69 270695a3 2022-08-30 op ($pfh, $path) = tempfile "/tmp/gotmarc.index.XXXXXXXXXX";
70 270695a3 2022-08-30 op push @files, $path;
71 ebad21b1 2022-08-26 op say $pfh "<div class='thread'><ul>";
72 6fde8229 2022-08-26 op }
73 28ebc168 2022-08-24 op
74 6fde8229 2022-08-26 op sub nav {
75 43c49583 2022-08-27 op my ($pfh, $n) = @_;
76 43c49583 2022-08-27 op my ($first, $last) = (pagename(1), pagename($page));
77 6fde8229 2022-08-26 op my ($next, $prev) = (pagename($n+1), pagename($n-1));
78 28ebc168 2022-08-24 op
79 2eb655f1 2022-08-27 op say $pfh "<nav>";
80 1913b2fb 2022-08-26 op say $pfh "<a href='$first'>First</a>" if $n > 2;
81 1913b2fb 2022-08-26 op say $pfh "<a href='$prev'>Prev</a>" if $n > 1;
82 6fde8229 2022-08-26 op say $pfh "<a href='$next'>Next</a>" if $n < $page;
83 6fde8229 2022-08-26 op say $pfh "<a href='$last'>Last</a>" if $n < $page - 1;
84 6fde8229 2022-08-26 op say $pfh "</nav>";
85 6fde8229 2022-08-26 op }
86 4d7b2baa 2022-08-26 op
87 6fde8229 2022-08-26 op sub copyfrom {
88 6fde8229 2022-08-26 op my ($path, $fh) = @_;
89 6fde8229 2022-08-26 op
90 6fde8229 2022-08-26 op # there are probably faster ways to do this like File::Copy,
91 6fde8229 2022-08-26 op # but it bypasses the bufio cache...
92 6fde8229 2022-08-26 op open(my $pfh, '<', $path) or die "can't open $path: $!";
93 890362cd 2022-08-30 op print $fh $_ while <$pfh>;
94 28ebc168 2022-08-24 op }
95 28ebc168 2022-08-24 op
96 add05cb0 2022-08-27 op sub renderpages {
97 28ebc168 2022-08-24 op close($pfh);
98 28ebc168 2022-08-24 op
99 1913b2fb 2022-08-26 op for (my $i = 1; $i <= $page; $i++) {
100 66e1cf97 2022-08-27 op my $name = pagename($i);
101 270695a3 2022-08-30 op my $path = shift @files;
102 66e1cf97 2022-08-27 op my $dest = "$outdir/$name";
103 28ebc168 2022-08-24 op
104 6fde8229 2022-08-26 op open(my $pfh, '>', $dest)
105 6fde8229 2022-08-26 op or die "can't open $dest for writing: $!";
106 28ebc168 2022-08-24 op
107 d40f4fe2 2022-08-26 op my $title = "Game of Trees Mail Archive | page $i";
108 d40f4fe2 2022-08-26 op my $subtitle = $pages[$i-1];
109 28ebc168 2022-08-24 op
110 9ec6c848 2022-08-27 op initpage($pfh, $title);
111 9ec6c848 2022-08-27 op index_header $pfh, $i, $subtitle;
112 9ec6c848 2022-08-27 op say $pfh "<main>";
113 6fde8229 2022-08-26 op
114 43c49583 2022-08-27 op nav $pfh, $i if $page > 1;
115 6fde8229 2022-08-26 op copyfrom($path, $pfh);
116 43c49583 2022-08-27 op nav $pfh, $i if $page > 1;
117 6fde8229 2022-08-26 op
118 e773a9f0 2022-08-24 op say $pfh "</main>";
119 e773a9f0 2022-08-24 op endpage($pfh);
120 8d17053d 2022-08-26 op
121 9ec6c848 2022-08-27 op close($pfh);
122 8d17053d 2022-08-26 op unlink $path;
123 28ebc168 2022-08-24 op }
124 28ebc168 2022-08-24 op }
125 28ebc168 2022-08-24 op
126 eefeacb7 2022-08-27 op sub endthread {
127 eefeacb7 2022-08-27 op say $tfh "</ul></li>" x $last_level;
128 c13d576c 2022-08-27 op say $tfh "</ul>\n</div>\n";
129 eefeacb7 2022-08-27 op endpage($tfh);
130 eefeacb7 2022-08-27 op close($tfh);
131 eefeacb7 2022-08-27 op
132 eefeacb7 2022-08-27 op $last_level = 0;
133 eefeacb7 2022-08-27 op }
134 eefeacb7 2022-08-27 op
135 7d6d378a 2022-08-24 op sub nextthread {
136 eefeacb7 2022-08-27 op endthread if defined $tfh;
137 7d6d378a 2022-08-24 op my ($mid, $subj) = @_;
138 7d6d378a 2022-08-24 op my $dest = "$outdir/thread/$mid.html";
139 7d6d378a 2022-08-24 op open($tfh, '>', $dest) or die "can't open $dest: $!";
140 7d6d378a 2022-08-24 op initpage($tfh, $subj);
141 9d8482ab 2022-08-27 op thread_header $tfh, undef, undef, ["Thread: $subj"];
142 c13d576c 2022-08-27 op print $tfh "<div class='thread'><ul class='mails'>\n";
143 7d6d378a 2022-08-24 op }
144 7d6d378a 2022-08-24 op
145 ebad21b1 2022-08-26 op sub entry {
146 ebad21b1 2022-08-26 op my ($fh, $type, $mid, $date, $from, $subj) = @_;
147 f0fb0f08 2022-08-30 op my $encmid = urlencode $mid;
148 f0fb0f08 2022-08-30 op
149 f0fb0f08 2022-08-30 op print $fh "<li id='$encmid' class='mail'>";
150 7d6d378a 2022-08-24 op print $fh "<p class='mail-meta'>";
151 7d6d378a 2022-08-24 op print $fh "<time>$date</time> ";
152 7d6d378a 2022-08-24 op print $fh "<span class='from'>$from</span>";
153 7d6d378a 2022-08-24 op print $fh "<span class='colon'>:</span>";
154 7d6d378a 2022-08-24 op print $fh "</p>";
155 7d6d378a 2022-08-24 op print $fh "<p class='subject'>";
156 f0fb0f08 2022-08-30 op print $fh "<a href='/$type/$encmid.html'>$subj</a>";
157 7d6d378a 2022-08-24 op print $fh "</p>";
158 584d65d8 2022-08-24 op print $fh "</li>\n";
159 7d6d378a 2022-08-24 op }
160 7d6d378a 2022-08-24 op
161 debcbab2 2022-09-13 op sub index_entry {
162 debcbab2 2022-09-13 op my ($fh, $mid, $date, $from, $subj) = @_;
163 debcbab2 2022-09-13 op
164 debcbab2 2022-09-13 op entry $fh, "thread", $mid, $date, $from, $subj;
165 debcbab2 2022-09-13 op }
166 debcbab2 2022-09-13 op
167 ebad21b1 2022-08-26 op sub thread_entry {
168 ebad21b1 2022-08-26 op my ($fh, $mid, $level, $date, $from, $subj) = @_;
169 ebad21b1 2022-08-26 op
170 ebad21b1 2022-08-26 op say $fh "</ul>\n</li>" x ($last_level - $level) if $last_level > $level;
171 098db096 2022-08-27 op say $fh "<li>\n<ul>" if $last_level < $level;
172 ebad21b1 2022-08-26 op
173 ebad21b1 2022-08-26 op entry $fh, "mail", $mid, $date, $from, $subj;
174 7d6d378a 2022-08-24 op }
175 7d6d378a 2022-08-24 op
176 054f3fd4 2022-08-25 op unveil($outdir, "rwc") or die "unveil $outdir: $!";
177 66e1cf97 2022-08-27 op unveil(".", "r") or die "unveil .: $!";
178 270695a3 2022-08-30 op
179 270695a3 2022-08-30 op # can't use tmppath because File::Temp checks wether /tmp exists.
180 66e1cf97 2022-08-27 op unveil("/tmp", "rwc") or die "unveil /tmp: $!";
181 054f3fd4 2022-08-25 op
182 270695a3 2022-08-30 op # fattr for File::Temp
183 270695a3 2022-08-30 op pledge("stdio rpath wpath cpath fattr") or die "pledge: $!";
184 53bec6d4 2022-08-25 op
185 ebad21b1 2022-08-26 op nextfile;
186 7d6d378a 2022-08-24 op
187 7d6d378a 2022-08-24 op while (<>) {
188 de557185 2022-08-26 op my ($level, $fname, $mid, $date, $from, $subj) = parse;
189 7d6d378a 2022-08-24 op
190 ebad21b1 2022-08-26 op if ($level == 0) {
191 ebad21b1 2022-08-26 op nextthread $mid, $subj;
192 ebad21b1 2022-08-26 op
193 c5dff871 2022-08-29 op $threads++;
194 c5dff871 2022-08-29 op if ($threads > $threads_per_page) {
195 ebad21b1 2022-08-26 op nextfile;
196 c5dff871 2022-08-29 op $threads = 0;
197 d40f4fe2 2022-08-26 op $to_day = undef;
198 d40f4fe2 2022-08-26 op $from_day = undef;
199 ebad21b1 2022-08-26 op }
200 a0b4d4b3 2022-08-27 op
201 a0b4d4b3 2022-08-27 op my $day = $date =~ s/ .*//r;
202 a0b4d4b3 2022-08-27 op $to_day = mins $day, $to_day;
203 a0b4d4b3 2022-08-27 op $from_day = maxs $day, $from_day;
204 ebad21b1 2022-08-26 op }
205 ebad21b1 2022-08-26 op
206 b539aacd 2022-08-27 op thread_entry $tfh, $mid, $level, $date, $from, $subj;
207 584d65d8 2022-08-24 op $last_level = $level;
208 584d65d8 2022-08-24 op $threads_seen = 1;
209 debcbab2 2022-09-13 op
210 debcbab2 2022-09-13 op index_entry $pfh, $last_tid, $last_date, $last_from, $last_subj
211 debcbab2 2022-09-13 op if defined $last_tid && $level == 0;
212 debcbab2 2022-09-13 op
213 debcbab2 2022-09-13 op $last_tid = $mid if $level == 0;
214 debcbab2 2022-09-13 op $last_date = $date;
215 debcbab2 2022-09-13 op $last_from = $from;
216 debcbab2 2022-09-13 op $last_subj = $subj if $level == 0;
217 7d6d378a 2022-08-24 op }
218 7d6d378a 2022-08-24 op
219 debcbab2 2022-09-13 op index_entry $pfh, $last_tid, $last_date, $last_from, $last_subj
220 debcbab2 2022-09-13 op if defined $last_tid;
221 debcbab2 2022-09-13 op
222 ebad21b1 2022-08-26 op endfile;
223 ebad21b1 2022-08-26 op endthread if $threads_seen;
224 add05cb0 2022-08-27 op renderpages;