Blame


1 5e11c00c 2021-03-02 op /*
2 5e11c00c 2021-03-02 op * Copyright (c) 2021 Omar Polo <op@omarpolo.com>
3 5e11c00c 2021-03-02 op *
4 5e11c00c 2021-03-02 op * Permission to use, copy, modify, and distribute this software for any
5 5e11c00c 2021-03-02 op * purpose with or without fee is hereby granted, provided that the above
6 5e11c00c 2021-03-02 op * copyright notice and this permission notice appear in all copies.
7 5e11c00c 2021-03-02 op *
8 5e11c00c 2021-03-02 op * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
9 5e11c00c 2021-03-02 op * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
10 5e11c00c 2021-03-02 op * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
11 5e11c00c 2021-03-02 op * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
12 5e11c00c 2021-03-02 op * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
13 5e11c00c 2021-03-02 op * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
14 5e11c00c 2021-03-02 op * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
15 5e11c00c 2021-03-02 op */
16 5e11c00c 2021-03-02 op
17 5e11c00c 2021-03-02 op /*
18 5e11c00c 2021-03-02 op * A streaming gemtext parser.
19 5e11c00c 2021-03-02 op *
20 5e11c00c 2021-03-02 op * TODO:
21 5e11c00c 2021-03-02 op * - handle NULs
22 5e11c00c 2021-03-02 op * - UTF8
23 5e11c00c 2021-03-02 op */
24 5e11c00c 2021-03-02 op
25 5e11c00c 2021-03-02 op #include <telescope.h>
26 5e11c00c 2021-03-02 op
27 5e11c00c 2021-03-02 op #include <ctype.h>
28 5e11c00c 2021-03-02 op #include <string.h>
29 5e11c00c 2021-03-02 op #include <stdlib.h>
30 5e11c00c 2021-03-02 op
31 5e11c00c 2021-03-02 op static int gemtext_parse(struct parser*, const char*, size_t);
32 a5c3e03d 2021-03-02 op static int gemtext_free(struct parser*);
33 5e11c00c 2021-03-02 op
34 5e11c00c 2021-03-02 op static int parse_text(struct parser*, enum line_type, const char*, size_t);
35 5e11c00c 2021-03-02 op static int parse_link(struct parser*, enum line_type, const char*, size_t);
36 5e11c00c 2021-03-02 op static int parse_title(struct parser*, enum line_type, const char*, size_t);
37 5e11c00c 2021-03-02 op static int parse_item(struct parser*, enum line_type, const char*, size_t);
38 5e11c00c 2021-03-02 op static int parse_quote(struct parser*, enum line_type, const char*, size_t);
39 5e11c00c 2021-03-02 op static int parse_pre_start(struct parser*, enum line_type, const char*, size_t);
40 5e11c00c 2021-03-02 op static int parse_pre_cnt(struct parser*, enum line_type, const char*, size_t);
41 5e11c00c 2021-03-02 op static int parse_pre_end(struct parser*, enum line_type, const char*, size_t);
42 5e11c00c 2021-03-02 op
43 5e11c00c 2021-03-02 op typedef int (parselinefn)(struct parser*, enum line_type, const char*, size_t);
44 5e11c00c 2021-03-02 op
45 5e11c00c 2021-03-02 op static parselinefn *parsers[] = {
46 5e11c00c 2021-03-02 op parse_text, /* LINE_TEXT */
47 5e11c00c 2021-03-02 op parse_link, /* LINE_LINK */
48 5e11c00c 2021-03-02 op parse_title, /* LINE_TITLE_1 */
49 5e11c00c 2021-03-02 op parse_title, /* LINE_TITLE_2 */
50 5e11c00c 2021-03-02 op parse_title, /* LINE_TITLE_3 */
51 5e11c00c 2021-03-02 op parse_item, /* LINE_ITEM */
52 5e11c00c 2021-03-02 op parse_quote, /* LINE_QUOTE */
53 5e11c00c 2021-03-02 op parse_pre_start, /* LINE_PRE_START */
54 5e11c00c 2021-03-02 op parse_pre_cnt, /* LINE_PRE_CONTENT */
55 5e11c00c 2021-03-02 op parse_pre_end, /* LINE_PRE_END */
56 5e11c00c 2021-03-02 op };
57 5e11c00c 2021-03-02 op
58 5e11c00c 2021-03-02 op void
59 5e11c00c 2021-03-02 op gemtext_initparser(struct parser *p)
60 5e11c00c 2021-03-02 op {
61 5e11c00c 2021-03-02 op memset(p, 0, sizeof(*p));
62 5e11c00c 2021-03-02 op
63 5e11c00c 2021-03-02 op p->parse = &gemtext_parse;
64 5e11c00c 2021-03-02 op p->free = &gemtext_free;
65 5e11c00c 2021-03-02 op }
66 5e11c00c 2021-03-02 op
67 5e11c00c 2021-03-02 op static inline int
68 5e11c00c 2021-03-02 op emit_line(struct parser *p, enum line_type type, char *line, char *alt)
69 5e11c00c 2021-03-02 op {
70 5e11c00c 2021-03-02 op struct line *l;
71 5e11c00c 2021-03-02 op
72 5e11c00c 2021-03-02 op if ((l = calloc(1, sizeof(*l))) == NULL)
73 5e11c00c 2021-03-02 op return 0;
74 5e11c00c 2021-03-02 op
75 5e11c00c 2021-03-02 op l->type = type;
76 5e11c00c 2021-03-02 op l->line = line;
77 5e11c00c 2021-03-02 op l->alt = alt;
78 5e11c00c 2021-03-02 op
79 5e11c00c 2021-03-02 op if (TAILQ_EMPTY(&p->head))
80 5e11c00c 2021-03-02 op TAILQ_INSERT_HEAD(&p->head, l, lines);
81 5e11c00c 2021-03-02 op else
82 5e11c00c 2021-03-02 op TAILQ_INSERT_TAIL(&p->head, l, lines);
83 5e11c00c 2021-03-02 op
84 5e11c00c 2021-03-02 op return 1;
85 5e11c00c 2021-03-02 op }
86 5e11c00c 2021-03-02 op
87 5e11c00c 2021-03-02 op static int
88 5e11c00c 2021-03-02 op parse_text(struct parser *p, enum line_type t, const char *buf, size_t len)
89 5e11c00c 2021-03-02 op {
90 5e11c00c 2021-03-02 op char *l;
91 5e11c00c 2021-03-02 op
92 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
93 5e11c00c 2021-03-02 op return 0;
94 5e11c00c 2021-03-02 op memcpy(l, buf, len);
95 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
96 5e11c00c 2021-03-02 op }
97 5e11c00c 2021-03-02 op
98 5e11c00c 2021-03-02 op static int
99 5e11c00c 2021-03-02 op parse_link(struct parser *p, enum line_type t, const char *buf, size_t len)
100 5e11c00c 2021-03-02 op {
101 5e11c00c 2021-03-02 op char *l, *u;
102 5e11c00c 2021-03-02 op const char *url_start;
103 5e11c00c 2021-03-02 op
104 5e11c00c 2021-03-02 op if (len <= 2)
105 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
106 5e11c00c 2021-03-02 op buf += 2;
107 5e11c00c 2021-03-02 op len -= 2;
108 5e11c00c 2021-03-02 op
109 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
110 5e11c00c 2021-03-02 op buf++;
111 5e11c00c 2021-03-02 op len--;
112 5e11c00c 2021-03-02 op }
113 5e11c00c 2021-03-02 op
114 5e11c00c 2021-03-02 op if (len == 0)
115 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
116 5e11c00c 2021-03-02 op
117 5e11c00c 2021-03-02 op url_start = buf;
118 5e11c00c 2021-03-02 op while (len > 0 && !isspace(buf[0])) {
119 5e11c00c 2021-03-02 op buf++;
120 5e11c00c 2021-03-02 op len--;
121 5e11c00c 2021-03-02 op }
122 5e11c00c 2021-03-02 op
123 5e11c00c 2021-03-02 op if ((u = calloc(1, buf - url_start + 1)) == NULL)
124 5e11c00c 2021-03-02 op return 0;
125 5e11c00c 2021-03-02 op memcpy(u, url_start, buf - url_start);
126 5e11c00c 2021-03-02 op
127 5e11c00c 2021-03-02 op if (len == 0)
128 f250a75b 2021-03-06 op goto nolabel;
129 5e11c00c 2021-03-02 op
130 f250a75b 2021-03-06 op while (len > 0 && isspace(buf[0])) {
131 5e11c00c 2021-03-02 op buf++;
132 5e11c00c 2021-03-02 op len--;
133 5e11c00c 2021-03-02 op }
134 5e11c00c 2021-03-02 op
135 5e11c00c 2021-03-02 op if (len == 0)
136 f250a75b 2021-03-06 op goto nolabel;
137 5e11c00c 2021-03-02 op
138 5e11c00c 2021-03-02 op if ((l = calloc(1, len + 1)) == NULL)
139 5e11c00c 2021-03-02 op return 0;
140 5e11c00c 2021-03-02 op
141 5e11c00c 2021-03-02 op memcpy(l, buf, len);
142 f250a75b 2021-03-06 op return emit_line(p, t, l, u);
143 f250a75b 2021-03-06 op
144 f250a75b 2021-03-06 op nolabel:
145 f250a75b 2021-03-06 op if ((l = strdup(u)) == NULL)
146 f250a75b 2021-03-06 op return 0;
147 f250a75b 2021-03-06 op return emit_line(p, t, l, u);
148 5e11c00c 2021-03-02 op }
149 5e11c00c 2021-03-02 op
150 5e11c00c 2021-03-02 op static int
151 5e11c00c 2021-03-02 op parse_title(struct parser *p, enum line_type t, const char *buf, size_t len)
152 5e11c00c 2021-03-02 op {
153 5e11c00c 2021-03-02 op char *l;
154 5e11c00c 2021-03-02 op
155 5e11c00c 2021-03-02 op switch (t) {
156 5e11c00c 2021-03-02 op case LINE_TITLE_1:
157 5e11c00c 2021-03-02 op if (len <= 1)
158 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
159 5e11c00c 2021-03-02 op buf++;
160 5e11c00c 2021-03-02 op len--;
161 5e11c00c 2021-03-02 op break;
162 5e11c00c 2021-03-02 op case LINE_TITLE_2:
163 5e11c00c 2021-03-02 op if (len <= 2)
164 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
165 5e11c00c 2021-03-02 op buf += 2;
166 5e11c00c 2021-03-02 op len -= 2;
167 5e11c00c 2021-03-02 op break;
168 5e11c00c 2021-03-02 op case LINE_TITLE_3:
169 5e11c00c 2021-03-02 op if (len <= 3)
170 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
171 5e11c00c 2021-03-02 op buf += 3;
172 5e11c00c 2021-03-02 op len -= 3;
173 5e11c00c 2021-03-02 op break;
174 5e11c00c 2021-03-02 op default:
175 5e11c00c 2021-03-02 op /* unreachable */
176 5e11c00c 2021-03-02 op abort();
177 5e11c00c 2021-03-02 op }
178 5e11c00c 2021-03-02 op
179 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
180 5e11c00c 2021-03-02 op buf++;
181 5e11c00c 2021-03-02 op len--;
182 5e11c00c 2021-03-02 op }
183 5e11c00c 2021-03-02 op
184 5e11c00c 2021-03-02 op if (len == 0)
185 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
186 5e11c00c 2021-03-02 op
187 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
188 5e11c00c 2021-03-02 op return 0;
189 5e11c00c 2021-03-02 op memcpy(l, buf, len);
190 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
191 5e11c00c 2021-03-02 op }
192 5e11c00c 2021-03-02 op
193 5e11c00c 2021-03-02 op static int
194 5e11c00c 2021-03-02 op parse_item(struct parser *p, enum line_type t, const char *buf, size_t len)
195 5e11c00c 2021-03-02 op {
196 5e11c00c 2021-03-02 op char *l;
197 5e11c00c 2021-03-02 op
198 5e11c00c 2021-03-02 op if (len == 1)
199 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
200 5e11c00c 2021-03-02 op
201 5e11c00c 2021-03-02 op buf++;
202 5e11c00c 2021-03-02 op len--;
203 5e11c00c 2021-03-02 op
204 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
205 5e11c00c 2021-03-02 op buf++;
206 5e11c00c 2021-03-02 op len--;
207 5e11c00c 2021-03-02 op }
208 5e11c00c 2021-03-02 op
209 5e11c00c 2021-03-02 op if (len == 0)
210 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
211 5e11c00c 2021-03-02 op
212 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
213 5e11c00c 2021-03-02 op return 0;
214 5e11c00c 2021-03-02 op memcpy(l, buf, len);
215 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
216 5e11c00c 2021-03-02 op }
217 5e11c00c 2021-03-02 op
218 5e11c00c 2021-03-02 op static int
219 5e11c00c 2021-03-02 op parse_quote(struct parser *p, enum line_type t, const char *buf, size_t len)
220 5e11c00c 2021-03-02 op {
221 5e11c00c 2021-03-02 op char *l;
222 5e11c00c 2021-03-02 op
223 5e11c00c 2021-03-02 op if (len == 1)
224 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
225 5e11c00c 2021-03-02 op
226 5e11c00c 2021-03-02 op buf++;
227 5e11c00c 2021-03-02 op len--;
228 5e11c00c 2021-03-02 op
229 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
230 5e11c00c 2021-03-02 op buf++;
231 5e11c00c 2021-03-02 op len--;
232 5e11c00c 2021-03-02 op }
233 5e11c00c 2021-03-02 op
234 5e11c00c 2021-03-02 op if (len == 0)
235 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
236 5e11c00c 2021-03-02 op
237 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
238 5e11c00c 2021-03-02 op return 0;
239 5e11c00c 2021-03-02 op memcpy(l, buf, len);
240 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
241 5e11c00c 2021-03-02 op }
242 5e11c00c 2021-03-02 op
243 5e11c00c 2021-03-02 op static int
244 5e11c00c 2021-03-02 op parse_pre_start(struct parser *p, enum line_type t, const char *buf, size_t len)
245 5e11c00c 2021-03-02 op {
246 5e11c00c 2021-03-02 op char *l;
247 5e11c00c 2021-03-02 op
248 5e11c00c 2021-03-02 op if (len <= 3)
249 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
250 5e11c00c 2021-03-02 op
251 5e11c00c 2021-03-02 op buf += 3;
252 5e11c00c 2021-03-02 op len += 3;
253 5e11c00c 2021-03-02 op
254 5e11c00c 2021-03-02 op while (len > 0 && isspace(buf[0])) {
255 5e11c00c 2021-03-02 op buf++;
256 5e11c00c 2021-03-02 op len--;
257 5e11c00c 2021-03-02 op }
258 5e11c00c 2021-03-02 op
259 5e11c00c 2021-03-02 op if (len == 0)
260 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
261 5e11c00c 2021-03-02 op
262 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
263 5e11c00c 2021-03-02 op return 0;
264 5e11c00c 2021-03-02 op
265 5e11c00c 2021-03-02 op memcpy(l, buf, len);
266 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, l);
267 5e11c00c 2021-03-02 op }
268 5e11c00c 2021-03-02 op
269 5e11c00c 2021-03-02 op static int
270 5e11c00c 2021-03-02 op parse_pre_cnt(struct parser *p, enum line_type t, const char *buf, size_t len)
271 5e11c00c 2021-03-02 op {
272 5e11c00c 2021-03-02 op char *l;
273 5e11c00c 2021-03-02 op
274 5e11c00c 2021-03-02 op if (len == 0)
275 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
276 5e11c00c 2021-03-02 op
277 5e11c00c 2021-03-02 op if ((l = calloc(1, len+1)) == NULL)
278 5e11c00c 2021-03-02 op return 0;
279 5e11c00c 2021-03-02 op memcpy(l, buf, len);
280 5e11c00c 2021-03-02 op return emit_line(p, t, l, NULL);
281 5e11c00c 2021-03-02 op }
282 5e11c00c 2021-03-02 op
283 5e11c00c 2021-03-02 op static int
284 5e11c00c 2021-03-02 op parse_pre_end(struct parser *p, enum line_type t, const char *buf, size_t len)
285 5e11c00c 2021-03-02 op {
286 5e11c00c 2021-03-02 op return emit_line(p, t, NULL, NULL);
287 5e11c00c 2021-03-02 op }
288 5e11c00c 2021-03-02 op
289 5e11c00c 2021-03-02 op static inline enum line_type
290 5e11c00c 2021-03-02 op detect_line_type(const char *buf, size_t len, int in_pre)
291 5e11c00c 2021-03-02 op {
292 5e11c00c 2021-03-02 op size_t i;
293 5e11c00c 2021-03-02 op
294 5e11c00c 2021-03-02 op if (len == 0)
295 5e11c00c 2021-03-02 op return LINE_TEXT;
296 5e11c00c 2021-03-02 op
297 5e11c00c 2021-03-02 op if (in_pre) {
298 5e11c00c 2021-03-02 op if (len >= 3 &&
299 5e11c00c 2021-03-02 op buf[0] == '`' && buf[1] == '`' && buf[2] == '`')
300 5e11c00c 2021-03-02 op return LINE_PRE_END;
301 5e11c00c 2021-03-02 op else
302 5e11c00c 2021-03-02 op return LINE_PRE_CONTENT;
303 5e11c00c 2021-03-02 op }
304 5e11c00c 2021-03-02 op
305 5e11c00c 2021-03-02 op switch (*buf) {
306 5e11c00c 2021-03-02 op case '*': return LINE_ITEM;
307 5e11c00c 2021-03-02 op case '>': return LINE_QUOTE;
308 5e11c00c 2021-03-02 op case '=':
309 5e11c00c 2021-03-02 op if (len >= 1 && buf[1] == '>')
310 5e11c00c 2021-03-02 op return LINE_LINK;
311 5e11c00c 2021-03-02 op break;
312 5e11c00c 2021-03-02 op case '#':
313 5e11c00c 2021-03-02 op if (len == 1)
314 5e11c00c 2021-03-02 op return LINE_TEXT;
315 5e11c00c 2021-03-02 op if (buf[1] != '#')
316 5e11c00c 2021-03-02 op return LINE_TITLE_1;
317 5e11c00c 2021-03-02 op if (len == 2)
318 5e11c00c 2021-03-02 op return LINE_TEXT;
319 5e11c00c 2021-03-02 op if (buf[2] != '#')
320 5e11c00c 2021-03-02 op return LINE_TITLE_2;
321 5e11c00c 2021-03-02 op if (len == 3)
322 5e11c00c 2021-03-02 op return LINE_TEXT;
323 5e11c00c 2021-03-02 op return LINE_TITLE_3;
324 5e11c00c 2021-03-02 op case '`':
325 5e11c00c 2021-03-02 op if (len < 3)
326 5e11c00c 2021-03-02 op return LINE_TEXT;
327 5e11c00c 2021-03-02 op if (buf[0] == '`' && buf[1] == '`' && buf[2] == '`')
328 5e11c00c 2021-03-02 op return LINE_PRE_START;
329 5e11c00c 2021-03-02 op break;
330 5e11c00c 2021-03-02 op }
331 5e11c00c 2021-03-02 op
332 5e11c00c 2021-03-02 op return LINE_TEXT;
333 5e11c00c 2021-03-02 op }
334 5e11c00c 2021-03-02 op
335 5e11c00c 2021-03-02 op static inline int
336 5e11c00c 2021-03-02 op append(struct parser *p, const char *buf, size_t len)
337 5e11c00c 2021-03-02 op {
338 5e11c00c 2021-03-02 op size_t newlen;
339 5e11c00c 2021-03-02 op char *t;
340 5e11c00c 2021-03-02 op
341 5e11c00c 2021-03-02 op newlen = len + p->len;
342 5e11c00c 2021-03-02 op if ((t = calloc(1, newlen)) == NULL)
343 5e11c00c 2021-03-02 op return 0;
344 805283d1 2021-03-06 op memcpy(t, p->buf, p->len);
345 805283d1 2021-03-06 op memcpy(t + p->len, buf, len);
346 5e11c00c 2021-03-02 op free(p->buf);
347 5e11c00c 2021-03-02 op p->buf = t;
348 5e11c00c 2021-03-02 op p->len = newlen;
349 5e11c00c 2021-03-02 op return 1;
350 5e11c00c 2021-03-02 op }
351 5e11c00c 2021-03-02 op
352 5e11c00c 2021-03-02 op static inline int
353 5e11c00c 2021-03-02 op set_buf(struct parser *p, const char *buf, size_t len)
354 5e11c00c 2021-03-02 op {
355 5e11c00c 2021-03-02 op free(p->buf);
356 5e11c00c 2021-03-02 op p->buf = NULL;
357 5e11c00c 2021-03-02 op
358 805283d1 2021-03-06 op if (len == 0) {
359 805283d1 2021-03-06 op p->len = 0;
360 5e11c00c 2021-03-02 op return 1;
361 805283d1 2021-03-06 op }
362 5e11c00c 2021-03-02 op
363 5e11c00c 2021-03-02 op if ((p->buf = calloc(1, len)) == NULL)
364 5e11c00c 2021-03-02 op return 0;
365 5e11c00c 2021-03-02 op memcpy(p->buf, buf, len);
366 db1e2315 2021-03-02 op p->len = len;
367 5e11c00c 2021-03-02 op return 1;
368 5e11c00c 2021-03-02 op }
369 5e11c00c 2021-03-02 op
370 5e11c00c 2021-03-02 op static int
371 5e11c00c 2021-03-02 op gemtext_parse(struct parser *p, const char *buf, size_t size)
372 5e11c00c 2021-03-02 op {
373 5e11c00c 2021-03-02 op const char *b, *e;
374 5e11c00c 2021-03-02 op enum line_type t;
375 5e11c00c 2021-03-02 op size_t len, l;
376 5e11c00c 2021-03-02 op
377 5e11c00c 2021-03-02 op if (p->len == 0) {
378 5e11c00c 2021-03-02 op b = buf;
379 5e11c00c 2021-03-02 op len = size;
380 5e11c00c 2021-03-02 op } else {
381 5e11c00c 2021-03-02 op if (!append(p, buf, size))
382 5e11c00c 2021-03-02 op return 0;
383 5e11c00c 2021-03-02 op b = p->buf;
384 5e11c00c 2021-03-02 op len = p->len;
385 5e11c00c 2021-03-02 op }
386 5e11c00c 2021-03-02 op
387 5e11c00c 2021-03-02 op while (len > 0) {
388 5e11c00c 2021-03-02 op if ((e = telescope_strnchr((char*)b, '\n', len)) == NULL)
389 5e11c00c 2021-03-02 op break;
390 5e11c00c 2021-03-02 op l = e - b;
391 5e11c00c 2021-03-02 op t = detect_line_type(b, l, p->flags);
392 5e11c00c 2021-03-02 op if (t == LINE_PRE_START)
393 5e11c00c 2021-03-02 op p->flags = 1;
394 5e11c00c 2021-03-02 op if (t == LINE_PRE_END)
395 5e11c00c 2021-03-02 op p->flags = 0;
396 5e11c00c 2021-03-02 op if (!parsers[t](p, t, b, l))
397 5e11c00c 2021-03-02 op return 0;
398 5e11c00c 2021-03-02 op
399 5e11c00c 2021-03-02 op len -= l;
400 5e11c00c 2021-03-02 op b += l;
401 5e11c00c 2021-03-02 op
402 5e11c00c 2021-03-02 op if (len > 0) {
403 5e11c00c 2021-03-02 op /* skip \n */
404 5e11c00c 2021-03-02 op len--;
405 5e11c00c 2021-03-02 op b++;
406 5e11c00c 2021-03-02 op }
407 5e11c00c 2021-03-02 op }
408 5e11c00c 2021-03-02 op
409 5e11c00c 2021-03-02 op return set_buf(p, b, len);
410 5e11c00c 2021-03-02 op }
411 5e11c00c 2021-03-02 op
412 a5c3e03d 2021-03-02 op static int
413 5e11c00c 2021-03-02 op gemtext_free(struct parser *p)
414 5e11c00c 2021-03-02 op {
415 a5c3e03d 2021-03-02 op enum line_type t;
416 a5c3e03d 2021-03-02 op
417 a5c3e03d 2021-03-02 op /* flush the buffer */
418 a5c3e03d 2021-03-02 op if (p->len != 0) {
419 a5c3e03d 2021-03-02 op t = detect_line_type(p->buf, p->len, p->flags);
420 a5c3e03d 2021-03-02 op if (!parsers[t](p, t, p->buf, p->len))
421 a5c3e03d 2021-03-02 op return 0;
422 a5c3e03d 2021-03-02 op if (p->flags && !emit_line(p, LINE_PRE_END, NULL, NULL))
423 a5c3e03d 2021-03-02 op return 0;
424 a5c3e03d 2021-03-02 op }
425 a5c3e03d 2021-03-02 op
426 5e11c00c 2021-03-02 op free(p->buf);
427 a5c3e03d 2021-03-02 op return 1;
428 5e11c00c 2021-03-02 op }