Blame


1 5e11c00c 2021-03-02 op /*
2 5e11c00c 2021-03-02 op * Copyright (c) 2021 Omar Polo <op@omarpolo.com>
3 5e11c00c 2021-03-02 op *
4 5e11c00c 2021-03-02 op * Permission to use, copy, modify, and distribute this software for any
5 5e11c00c 2021-03-02 op * purpose with or without fee is hereby granted, provided that the above
6 5e11c00c 2021-03-02 op * copyright notice and this permission notice appear in all copies.
7 5e11c00c 2021-03-02 op *
8 5e11c00c 2021-03-02 op * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
9 5e11c00c 2021-03-02 op * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
10 5e11c00c 2021-03-02 op * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
11 5e11c00c 2021-03-02 op * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
12 5e11c00c 2021-03-02 op * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
13 5e11c00c 2021-03-02 op * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
14 5e11c00c 2021-03-02 op * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
15 5e11c00c 2021-03-02 op */
16 5e11c00c 2021-03-02 op
17 5e11c00c 2021-03-02 op /*
18 5e11c00c 2021-03-02 op * A streaming gemtext parser.
19 5e11c00c 2021-03-02 op *
20 5e11c00c 2021-03-02 op * TODO:
21 5e11c00c 2021-03-02 op * - handle NULs
22 5e11c00c 2021-03-02 op * - UTF8
23 5e11c00c 2021-03-02 op */
24 5e11c00c 2021-03-02 op
25 5f2dc0bd 2021-07-13 op #include "defaults.h"
26 395b9f4e 2021-07-12 op #include "parser.h"
27 a4ec04c5 2021-05-13 op #include "telescope.h"
28 fbadd395 2021-07-16 op #include "utf8.h"
29 5e11c00c 2021-03-02 op
30 5e11c00c 2021-03-02 op #include <ctype.h>
31 5e11c00c 2021-03-02 op #include <string.h>
32 5e11c00c 2021-03-02 op #include <stdlib.h>
33 5e11c00c 2021-03-02 op
34 5e11c00c 2021-03-02 op static int gemtext_parse(struct parser*, const char*, size_t);
35 a5845bb5 2021-03-20 op static int gemtext_foreach_line(struct parser*, const char*, size_t);
36 a5c3e03d 2021-03-02 op static int gemtext_free(struct parser*);
37 5e11c00c 2021-03-02 op
38 5e11c00c 2021-03-02 op static int parse_text(struct parser*, enum line_type, const char*, size_t);
39 5e11c00c 2021-03-02 op static int parse_link(struct parser*, enum line_type, const char*, size_t);
40 5e11c00c 2021-03-02 op static int parse_title(struct parser*, enum line_type, const char*, size_t);
41 5e11c00c 2021-03-02 op static int parse_item(struct parser*, enum line_type, const char*, size_t);
42 5e11c00c 2021-03-02 op static int parse_quote(struct parser*, enum line_type, const char*, size_t);
43 5e11c00c 2021-03-02 op static int parse_pre_start(struct parser*, enum line_type, const char*, size_t);
44 5e11c00c 2021-03-02 op static int parse_pre_cnt(struct parser*, enum line_type, const char*, size_t);
45 5e11c00c 2021-03-02 op static int parse_pre_end(struct parser*, enum line_type, const char*, size_t);
46 48e3f26d 2021-05-13 op static void search_title(struct parser*, enum line_type);
47 5e11c00c 2021-03-02 op
48 5e11c00c 2021-03-02 op typedef int (parselinefn)(struct parser*, enum line_type, const char*, size_t);
49 5e11c00c 2021-03-02 op
50 5e11c00c 2021-03-02 op static parselinefn *parsers[] = {
51 3902f7b9 2021-07-14 op [LINE_TEXT] = parse_text,
52 3902f7b9 2021-07-14 op [LINE_LINK] = parse_link,
53 3902f7b9 2021-07-14 op [LINE_TITLE_1] = parse_title,
54 6b80b8fe 2021-07-14 op [LINE_TITLE_2] = parse_title,
55 3902f7b9 2021-07-14 op [LINE_TITLE_3] = parse_title,
56 6b80b8fe 2021-07-14 op [LINE_ITEM] = parse_item,
57 3902f7b9 2021-07-14 op [LINE_QUOTE] = parse_quote,
58 3902f7b9 2021-07-14 op [LINE_PRE_START] = parse_pre_start,
59 6b80b8fe 2021-07-14 op [LINE_PRE_CONTENT] = parse_pre_cnt,
60 3902f7b9 2021-07-14 op [LINE_PRE_END] = parse_pre_end,
61 5e11c00c 2021-03-02 op };
62 5e11c00c 2021-03-02 op
63 5e11c00c 2021-03-02 op void
64 5e11c00c 2021-03-02 op gemtext_initparser(struct parser *p)
65 5e11c00c 2021-03-02 op {
66 5e11c00c 2021-03-02 op memset(p, 0, sizeof(*p));
67 5e11c00c 2021-03-02 op
68 fc43eadd 2021-03-12 op p->name = "text/gemini";
69 5e11c00c 2021-03-02 op p->parse = &gemtext_parse;
70 5e11c00c 2021-03-02 op p->free = &gemtext_free;
71 5e11c00c 2021-03-02 op }
72 5e11c00c 2021-03-02 op
73 5e11c00c 2021-03-02 op static inline int
74 5e11c00c 2021-03-02 op emit_line(struct parser *p, enum line_type type, char *line, char *alt)
75 5e11c00c 2021-03-02 op {
76 5e11c00c 2021-03-02 op struct line *l;
77 5e11c00c 2021-03-02 op
78 5e11c00c 2021-03-02 op if ((l = calloc(1, sizeof(*l))) == NULL)
79 5e11c00c 2021-03-02 op return 0;
80 5e11c00c 2021-03-02 op
81 5e11c00c 2021-03-02 op l->type = type;
82 5e11c00c 2021-03-02 op l->line = line;
83 fbadd395 2021-07-16 op l->alt = alt;
84 5e11c00c 2021-03-02 op
85 b1379f34 2021-07-05 op switch (l->type) {
86 b1379f34 2021-07-05 op case LINE_PRE_START:
87 b1379f34 2021-07-05 op case LINE_PRE_END:
88 b1379f34 2021-07-05 op if (hide_pre_context)
89 b1379f34 2021-07-05 op l->flags = L_HIDDEN;
90 144733a7 2021-07-15 op if (l->type == LINE_PRE_END &&
91 144733a7 2021-07-15 op hide_pre_closing_line)
92 144733a7 2021-07-15 op l->flags = L_HIDDEN;
93 b1379f34 2021-07-05 op break;
94 b1379f34 2021-07-05 op case LINE_PRE_CONTENT:
95 b1379f34 2021-07-05 op if (hide_pre_blocks)
96 b1379f34 2021-07-05 op l->flags = L_HIDDEN;
97 b1379f34 2021-07-05 op break;
98 fbadd395 2021-07-16 op case LINE_LINK:
99 fbadd395 2021-07-16 op if (emojify_link &&
100 fbadd395 2021-07-16 op !emojied_line(line, (const char **)&l->data))
101 fbadd395 2021-07-16 op l->data = NULL;
102 fbadd395 2021-07-16 op break;
103 b1379f34 2021-07-05 op default:
104 b1379f34 2021-07-05 op break;
105 b1379f34 2021-07-05 op }
106 b1379f34 2021-07-05 op
107 5e11c00c 2021-03-02 op if (TAILQ_EMPTY(&p->head))
108 5e11c00c 2021-03-02 op TAILQ_INSERT_HEAD(&p->head, l, lines);
109 5e11c00c 2021-03-02 op else
110 5e11c00c 2021-03-02 op TAILQ_INSERT_TAIL(&p->head, l, lines);
111 5e11c00c 2021-03-02 op
112 5e11c00c 2021-03-02 op return 1;
113 5e11c00c 2021-03-02 op }
114 5e11c00c 2021-03-02 op
115 5e11c00c 2021-03-02 op static int
116 5e11c00c 2021-03-02 op parse_text(struct parser *p, enum line_type t, const char *buf, size_t len)
117 5e11c00c 2021-03-02 op {
118 5e11c00c 2021-03-02 op char *l;
119 5e11c00c 2021-03-02 op
120 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
121 5e11c00c 2021-03-02 op return 0;
122 5e11c00c 2021-03-02 op memcpy(l, buf, len);
123 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
124 5e11c00c 2021-03-02 op }
125 5e11c00c 2021-03-02 op
126 5e11c00c 2021-03-02 op static int
127 5e11c00c 2021-03-02 op parse_link(struct parser *p, enum line_type t, const char *buf, size_t len)
128 5e11c00c 2021-03-02 op {
129 5e11c00c 2021-03-02 op char *l, *u;
130 5e11c00c 2021-03-02 op const char *url_start;
131 5e11c00c 2021-03-02 op
132 5e11c00c 2021-03-02 op if (len <= 2)
133 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
134 5e11c00c 2021-03-02 op buf += 2;
135 5e11c00c 2021-03-02 op len -= 2;
136 5e11c00c 2021-03-02 op
137 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
138 5e11c00c 2021-03-02 op buf++;
139 5e11c00c 2021-03-02 op len--;
140 5e11c00c 2021-03-02 op }
141 5e11c00c 2021-03-02 op
142 5e11c00c 2021-03-02 op if (len == 0)
143 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
144 5e11c00c 2021-03-02 op
145 5e11c00c 2021-03-02 op url_start = buf;
146 5e11c00c 2021-03-02 op while (len > 0 && !isspace(buf[0])) {
147 5e11c00c 2021-03-02 op buf++;
148 5e11c00c 2021-03-02 op len--;
149 5e11c00c 2021-03-02 op }
150 5e11c00c 2021-03-02 op
151 5e11c00c 2021-03-02 op if ((u = calloc(1, buf - url_start + 1)) == NULL)
152 5e11c00c 2021-03-02 op return 0;
153 5e11c00c 2021-03-02 op memcpy(u, url_start, buf - url_start);
154 5e11c00c 2021-03-02 op
155 5e11c00c 2021-03-02 op if (len == 0)
156 f250a75b 2021-03-06 op goto nolabel;
157 5e11c00c 2021-03-02 op
158 f250a75b 2021-03-06 op while (len > 0 && isspace(buf[0])) {
159 5e11c00c 2021-03-02 op buf++;
160 5e11c00c 2021-03-02 op len--;
161 5e11c00c 2021-03-02 op }
162 5e11c00c 2021-03-02 op
163 5e11c00c 2021-03-02 op if (len == 0)
164 f250a75b 2021-03-06 op goto nolabel;
165 5e11c00c 2021-03-02 op
166 5e11c00c 2021-03-02 op if ((l = calloc(1, len + 1)) == NULL)
167 5e11c00c 2021-03-02 op return 0;
168 5e11c00c 2021-03-02 op
169 5e11c00c 2021-03-02 op memcpy(l, buf, len);
170 f250a75b 2021-03-06 op return emit_line(p, t, l, u);
171 f250a75b 2021-03-06 op
172 f250a75b 2021-03-06 op nolabel:
173 f250a75b 2021-03-06 op if ((l = strdup(u)) == NULL)
174 f250a75b 2021-03-06 op return 0;
175 f250a75b 2021-03-06 op return emit_line(p, t, l, u);
176 5e11c00c 2021-03-02 op }
177 5e11c00c 2021-03-02 op
178 5e11c00c 2021-03-02 op static int
179 5e11c00c 2021-03-02 op parse_title(struct parser *p, enum line_type t, const char *buf, size_t len)
180 5e11c00c 2021-03-02 op {
181 5e11c00c 2021-03-02 op char *l;
182 5e11c00c 2021-03-02 op
183 5e11c00c 2021-03-02 op switch (t) {
184 5e11c00c 2021-03-02 op case LINE_TITLE_1:
185 5e11c00c 2021-03-02 op if (len <= 1)
186 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
187 5e11c00c 2021-03-02 op buf++;
188 5e11c00c 2021-03-02 op len--;
189 5e11c00c 2021-03-02 op break;
190 5e11c00c 2021-03-02 op case LINE_TITLE_2:
191 5e11c00c 2021-03-02 op if (len <= 2)
192 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
193 5e11c00c 2021-03-02 op buf += 2;
194 5e11c00c 2021-03-02 op len -= 2;
195 5e11c00c 2021-03-02 op break;
196 5e11c00c 2021-03-02 op case LINE_TITLE_3:
197 5e11c00c 2021-03-02 op if (len <= 3)
198 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
199 5e11c00c 2021-03-02 op buf += 3;
200 5e11c00c 2021-03-02 op len -= 3;
201 5e11c00c 2021-03-02 op break;
202 5e11c00c 2021-03-02 op default:
203 5e11c00c 2021-03-02 op /* unreachable */
204 5e11c00c 2021-03-02 op abort();
205 5e11c00c 2021-03-02 op }
206 5e11c00c 2021-03-02 op
207 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
208 5e11c00c 2021-03-02 op buf++;
209 5e11c00c 2021-03-02 op len--;
210 5e11c00c 2021-03-02 op }
211 5e11c00c 2021-03-02 op
212 5e11c00c 2021-03-02 op if (len == 0)
213 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
214 5e11c00c 2021-03-02 op
215 dc5df781 2021-03-13 op if (t == LINE_TITLE_1 && *p->title == '\0')
216 dc5df781 2021-03-13 op strncpy(p->title, buf, MIN(sizeof(p->title)-1, len));
217 dc5df781 2021-03-13 op
218 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
219 5e11c00c 2021-03-02 op return 0;
220 5e11c00c 2021-03-02 op memcpy(l, buf, len);
221 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
222 5e11c00c 2021-03-02 op }
223 5e11c00c 2021-03-02 op
224 5e11c00c 2021-03-02 op static int
225 5e11c00c 2021-03-02 op parse_item(struct parser *p, enum line_type t, const char *buf, size_t len)
226 5e11c00c 2021-03-02 op {
227 5e11c00c 2021-03-02 op char *l;
228 5e11c00c 2021-03-02 op
229 5e11c00c 2021-03-02 op if (len == 1)
230 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
231 5e11c00c 2021-03-02 op
232 5e11c00c 2021-03-02 op buf++;
233 5e11c00c 2021-03-02 op len--;
234 5e11c00c 2021-03-02 op
235 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
236 5e11c00c 2021-03-02 op buf++;
237 5e11c00c 2021-03-02 op len--;
238 5e11c00c 2021-03-02 op }
239 5e11c00c 2021-03-02 op
240 5e11c00c 2021-03-02 op if (len == 0)
241 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
242 5e11c00c 2021-03-02 op
243 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
244 5e11c00c 2021-03-02 op return 0;
245 5e11c00c 2021-03-02 op memcpy(l, buf, len);
246 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
247 5e11c00c 2021-03-02 op }
248 5e11c00c 2021-03-02 op
249 5e11c00c 2021-03-02 op static int
250 5e11c00c 2021-03-02 op parse_quote(struct parser *p, enum line_type t, const char *buf, size_t len)
251 5e11c00c 2021-03-02 op {
252 5e11c00c 2021-03-02 op char *l;
253 5e11c00c 2021-03-02 op
254 5e11c00c 2021-03-02 op if (len == 1)
255 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
256 5e11c00c 2021-03-02 op
257 5e11c00c 2021-03-02 op buf++;
258 5e11c00c 2021-03-02 op len--;
259 5e11c00c 2021-03-02 op
260 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
261 5e11c00c 2021-03-02 op buf++;
262 5e11c00c 2021-03-02 op len--;
263 5e11c00c 2021-03-02 op }
264 5e11c00c 2021-03-02 op
265 5e11c00c 2021-03-02 op if (len == 0)
266 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
267 5e11c00c 2021-03-02 op
268 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
269 5e11c00c 2021-03-02 op return 0;
270 5e11c00c 2021-03-02 op memcpy(l, buf, len);
271 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
272 5e11c00c 2021-03-02 op }
273 5e11c00c 2021-03-02 op
274 5e11c00c 2021-03-02 op static int
275 5e11c00c 2021-03-02 op parse_pre_start(struct parser *p, enum line_type t, const char *buf, size_t len)
276 5e11c00c 2021-03-02 op {
277 5e11c00c 2021-03-02 op char *l;
278 5e11c00c 2021-03-02 op
279 5e11c00c 2021-03-02 op if (len <= 3)
280 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
281 5e11c00c 2021-03-02 op
282 5e11c00c 2021-03-02 op buf += 3;
283 4c2d8c1a 2021-03-21 op len -= 3;
284 5e11c00c 2021-03-02 op
285 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
286 5e11c00c 2021-03-02 op buf++;
287 5e11c00c 2021-03-02 op len--;
288 5e11c00c 2021-03-02 op }
289 5e11c00c 2021-03-02 op
290 5e11c00c 2021-03-02 op if (len == 0)
291 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
292 5e11c00c 2021-03-02 op
293 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
294 5e11c00c 2021-03-02 op return 0;
295 5e11c00c 2021-03-02 op
296 5e11c00c 2021-03-02 op memcpy(l, buf, len);
297 e2060f05 2021-03-17 op return emit_line(p, t, l, NULL);
298 5e11c00c 2021-03-02 op }
299 5e11c00c 2021-03-02 op
300 5e11c00c 2021-03-02 op static int
301 5e11c00c 2021-03-02 op parse_pre_cnt(struct parser *p, enum line_type t, const char *buf, size_t len)
302 5e11c00c 2021-03-02 op {
303 5e11c00c 2021-03-02 op char *l;
304 5e11c00c 2021-03-02 op
305 5e11c00c 2021-03-02 op if (len == 0)
306 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
307 5e11c00c 2021-03-02 op
308 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
309 5e11c00c 2021-03-02 op return 0;
310 5e11c00c 2021-03-02 op memcpy(l, buf, len);
311 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
312 5e11c00c 2021-03-02 op }
313 5e11c00c 2021-03-02 op
314 5e11c00c 2021-03-02 op static int
315 5e11c00c 2021-03-02 op parse_pre_end(struct parser *p, enum line_type t, const char *buf, size_t len)
316 5e11c00c 2021-03-02 op {
317 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
318 5e11c00c 2021-03-02 op }
319 5e11c00c 2021-03-02 op
320 5e11c00c 2021-03-02 op static inline enum line_type
321 5e11c00c 2021-03-02 op detect_line_type(const char *buf, size_t len, int in_pre)
322 5e11c00c 2021-03-02 op {
323 5e11c00c 2021-03-02 op if (in_pre) {
324 5e11c00c 2021-03-02 op if (len >= 3 &&
325 5e11c00c 2021-03-02 op buf[0] == '`' && buf[1] == '`' && buf[2] == '`')
326 5e11c00c 2021-03-02 op return LINE_PRE_END;
327 5e11c00c 2021-03-02 op else
328 5e11c00c 2021-03-02 op return LINE_PRE_CONTENT;
329 5e11c00c 2021-03-02 op }
330 5e11c00c 2021-03-02 op
331 1575cb8a 2021-07-07 op if (len == 0)
332 1575cb8a 2021-07-07 op return LINE_TEXT;
333 1575cb8a 2021-07-07 op
334 5e11c00c 2021-03-02 op switch (*buf) {
335 5e11c00c 2021-03-02 op case '*': return LINE_ITEM;
336 5e11c00c 2021-03-02 op case '>': return LINE_QUOTE;
337 5e11c00c 2021-03-02 op case '=':
338 5e11c00c 2021-03-02 op if (len >= 1 && buf[1] == '>')
339 5e11c00c 2021-03-02 op return LINE_LINK;
340 5e11c00c 2021-03-02 op break;
341 5e11c00c 2021-03-02 op case '#':
342 5e11c00c 2021-03-02 op if (len == 1)
343 5e11c00c 2021-03-02 op return LINE_TEXT;
344 5e11c00c 2021-03-02 op if (buf[1] != '#')
345 5e11c00c 2021-03-02 op return LINE_TITLE_1;
346 5e11c00c 2021-03-02 op if (len == 2)
347 5e11c00c 2021-03-02 op return LINE_TEXT;
348 5e11c00c 2021-03-02 op if (buf[2] != '#')
349 5e11c00c 2021-03-02 op return LINE_TITLE_2;
350 5e11c00c 2021-03-02 op if (len == 3)
351 5e11c00c 2021-03-02 op return LINE_TEXT;
352 5e11c00c 2021-03-02 op return LINE_TITLE_3;
353 5e11c00c 2021-03-02 op case '`':
354 5e11c00c 2021-03-02 op if (len < 3)
355 5e11c00c 2021-03-02 op return LINE_TEXT;
356 5e11c00c 2021-03-02 op if (buf[0] == '`' && buf[1] == '`' && buf[2] == '`')
357 5e11c00c 2021-03-02 op return LINE_PRE_START;
358 5e11c00c 2021-03-02 op break;
359 5e11c00c 2021-03-02 op }
360 5e11c00c 2021-03-02 op
361 5e11c00c 2021-03-02 op return LINE_TEXT;
362 5e11c00c 2021-03-02 op }
363 5e11c00c 2021-03-02 op
364 5e11c00c 2021-03-02 op static int
365 5e11c00c 2021-03-02 op gemtext_parse(struct parser *p, const char *buf, size_t size)
366 5e11c00c 2021-03-02 op {
367 a5845bb5 2021-03-20 op return parser_foreach_line(p, buf, size, gemtext_foreach_line);
368 a5845bb5 2021-03-20 op }
369 5e11c00c 2021-03-02 op
370 a5845bb5 2021-03-20 op static int
371 a5845bb5 2021-03-20 op gemtext_foreach_line(struct parser *p, const char *line, size_t linelen)
372 a5845bb5 2021-03-20 op {
373 a5845bb5 2021-03-20 op enum line_type t;
374 5e11c00c 2021-03-02 op
375 27dce34f 2021-07-06 op t = detect_line_type(line, linelen, p->flags & PARSER_IN_PRE);
376 a5845bb5 2021-03-20 op if (t == LINE_PRE_START)
377 27dce34f 2021-07-06 op p->flags ^= PARSER_IN_PRE;
378 a5845bb5 2021-03-20 op if (t == LINE_PRE_END)
379 27dce34f 2021-07-06 op p->flags ^= PARSER_IN_PRE;
380 a5845bb5 2021-03-20 op return parsers[t](p, t, line, linelen);
381 5e11c00c 2021-03-02 op }
382 5e11c00c 2021-03-02 op
383 a5c3e03d 2021-03-02 op static int
384 5e11c00c 2021-03-02 op gemtext_free(struct parser *p)
385 5e11c00c 2021-03-02 op {
386 a5c3e03d 2021-03-02 op enum line_type t;
387 a5c3e03d 2021-03-02 op
388 a5c3e03d 2021-03-02 op /* flush the buffer */
389 a5c3e03d 2021-03-02 op if (p->len != 0) {
390 27dce34f 2021-07-06 op t = detect_line_type(p->buf, p->len, p->flags & PARSER_IN_PRE);
391 a5c3e03d 2021-03-02 op if (!parsers[t](p, t, p->buf, p->len))
392 a5c3e03d 2021-03-02 op return 0;
393 27dce34f 2021-07-06 op if ((p->flags & PARSER_IN_PRE) &&
394 27dce34f 2021-07-06 op !emit_line(p, LINE_PRE_END, NULL, NULL))
395 a5c3e03d 2021-03-02 op return 0;
396 a5c3e03d 2021-03-02 op }
397 a5c3e03d 2021-03-02 op
398 5e11c00c 2021-03-02 op free(p->buf);
399 48e3f26d 2021-05-13 op
400 48e3f26d 2021-05-13 op /*
401 48e3f26d 2021-05-13 op * use the first level 2 or 3 header as page title if none
402 48e3f26d 2021-05-13 op * found yet.
403 48e3f26d 2021-05-13 op */
404 48e3f26d 2021-05-13 op if (*p->title == '\0')
405 48e3f26d 2021-05-13 op search_title(p, LINE_TITLE_2);
406 48e3f26d 2021-05-13 op if (*p->title == '\0')
407 48e3f26d 2021-05-13 op search_title(p, LINE_TITLE_3);
408 48e3f26d 2021-05-13 op
409 a5c3e03d 2021-03-02 op return 1;
410 5e11c00c 2021-03-02 op }
411 48e3f26d 2021-05-13 op
412 48e3f26d 2021-05-13 op static void
413 48e3f26d 2021-05-13 op search_title(struct parser *p, enum line_type level)
414 48e3f26d 2021-05-13 op {
415 48e3f26d 2021-05-13 op struct line *l;
416 48e3f26d 2021-05-13 op
417 48e3f26d 2021-05-13 op TAILQ_FOREACH(l, &p->head, lines) {
418 48e3f26d 2021-05-13 op if (l->type == level) {
419 48e3f26d 2021-05-13 op if (l->line == NULL)
420 48e3f26d 2021-05-13 op continue;
421 48e3f26d 2021-05-13 op strlcpy(p->title, l->line, sizeof(p->title));
422 f2d2d7a1 2021-06-23 op break;
423 48e3f26d 2021-05-13 op }
424 48e3f26d 2021-05-13 op }
425 48e3f26d 2021-05-13 op }