Blame


1 b0a6bcf7 2022-09-13 op /*
2 b0a6bcf7 2022-09-13 op * Copyright (c) 2022 Omar Polo <op@omarpolo.com>
3 b0a6bcf7 2022-09-13 op * Copyright (c) 2006 - 2015 Reyk Floeter <reyk@openbsd.org>
4 b0a6bcf7 2022-09-13 op *
5 b0a6bcf7 2022-09-13 op * Permission to use, copy, modify, and distribute this software for any
6 b0a6bcf7 2022-09-13 op * purpose with or without fee is hereby granted, provided that the above
7 b0a6bcf7 2022-09-13 op * copyright notice and this permission notice appear in all copies.
8 b0a6bcf7 2022-09-13 op *
9 b0a6bcf7 2022-09-13 op * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
10 b0a6bcf7 2022-09-13 op * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
11 b0a6bcf7 2022-09-13 op * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
12 b0a6bcf7 2022-09-13 op * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
13 b0a6bcf7 2022-09-13 op * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
14 b0a6bcf7 2022-09-13 op * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
15 b0a6bcf7 2022-09-13 op * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
16 b0a6bcf7 2022-09-13 op */
17 b0a6bcf7 2022-09-13 op
18 b0a6bcf7 2022-09-13 op #include <sys/types.h>
19 b0a6bcf7 2022-09-13 op #include <sys/queue.h>
20 b0a6bcf7 2022-09-13 op #include <sys/tree.h>
21 b0a6bcf7 2022-09-13 op #include <sys/socket.h>
22 b0a6bcf7 2022-09-13 op #include <sys/uio.h>
23 b0a6bcf7 2022-09-13 op
24 b0a6bcf7 2022-09-13 op #include <netinet/in.h>
25 b0a6bcf7 2022-09-13 op #include <arpa/inet.h>
26 b0a6bcf7 2022-09-13 op #include <netdb.h>
27 b0a6bcf7 2022-09-13 op
28 b0a6bcf7 2022-09-13 op #include <asr.h>
29 b0a6bcf7 2022-09-13 op #include <ctype.h>
30 b0a6bcf7 2022-09-13 op #include <errno.h>
31 b0a6bcf7 2022-09-13 op #include <event.h>
32 33f4bf26 2022-09-14 op #include <fnmatch.h>
33 b0a6bcf7 2022-09-13 op #include <limits.h>
34 b0a6bcf7 2022-09-13 op #include <stdlib.h>
35 b0a6bcf7 2022-09-13 op #include <stdint.h>
36 b0a6bcf7 2022-09-13 op #include <stdio.h>
37 b0a6bcf7 2022-09-13 op #include <string.h>
38 b0a6bcf7 2022-09-13 op #include <imsg.h>
39 b0a6bcf7 2022-09-13 op #include <tls.h>
40 b0a6bcf7 2022-09-13 op #include <unistd.h>
41 b0a6bcf7 2022-09-13 op
42 83f0f95a 2022-09-29 op #include "config.h"
43 b0a6bcf7 2022-09-13 op #include "log.h"
44 b0a6bcf7 2022-09-13 op #include "proc.h"
45 bff58270 2022-09-19 op #include "tmpl.h"
46 b0a6bcf7 2022-09-13 op
47 b0a6bcf7 2022-09-13 op #include "galileo.h"
48 b0a6bcf7 2022-09-13 op
49 b0a6bcf7 2022-09-13 op #define MINIMUM(a, b) ((a) < (b) ? (a) : (b))
50 83f0f95a 2022-09-29 op
51 83f0f95a 2022-09-29 op #if HAVE_LIBEVENT2
52 83f0f95a 2022-09-29 op # define G_TOUT(t) ((t).tv_sec)
53 83f0f95a 2022-09-29 op #else
54 83f0f95a 2022-09-29 op # define G_TOUT(t) (t)
55 83f0f95a 2022-09-29 op #endif
56 b0a6bcf7 2022-09-13 op
57 b0a6bcf7 2022-09-13 op /* provided by OpenBSD' base libevent but not in any header? */
58 b0a6bcf7 2022-09-13 op extern void bufferevent_read_pressure_cb(struct evbuffer *, size_t,
59 b0a6bcf7 2022-09-13 op size_t, void *);
60 b0a6bcf7 2022-09-13 op
61 b0a6bcf7 2022-09-13 op void proxy_init(struct privsep *, struct privsep_proc *, void *);
62 b0a6bcf7 2022-09-13 op int proxy_launch(struct galileo *);
63 b0a6bcf7 2022-09-13 op void proxy_inflight_dec(const char *);
64 b0a6bcf7 2022-09-13 op int proxy_dispatch_parent(int, struct privsep_proc *, struct imsg *);
65 cb05cce7 2022-11-11 op int proxy_resurl(struct client *, const char *, char *, size_t);
66 c9dc4bc6 2022-09-13 op void proxy_translate_gemtext(struct client *);
67 b0a6bcf7 2022-09-13 op void proxy_resolved(struct asr_result *, void *);
68 b0a6bcf7 2022-09-13 op void proxy_connect(int, short, void *);
69 5163fbe9 2022-09-20 op int proxy_start_reply(struct client *, int, const char *);
70 b0a6bcf7 2022-09-13 op void proxy_read(struct bufferevent *, void *);
71 b0a6bcf7 2022-09-13 op void proxy_write(struct bufferevent *, void *);
72 b0a6bcf7 2022-09-13 op void proxy_error(struct bufferevent *, short, void *);
73 b0a6bcf7 2022-09-13 op int proxy_bufferevent_add(struct event *, int);
74 b0a6bcf7 2022-09-13 op void proxy_tls_writecb(int, short, void *);
75 b0a6bcf7 2022-09-13 op void proxy_tls_readcb(int, short, void *);
76 b0a6bcf7 2022-09-13 op
77 b0a6bcf7 2022-09-13 op static struct privsep_proc procs[] = {
78 b0a6bcf7 2022-09-13 op { "parent", PROC_PARENT, proxy_dispatch_parent },
79 b0a6bcf7 2022-09-13 op };
80 b0a6bcf7 2022-09-13 op
81 b0a6bcf7 2022-09-13 op volatile int proxy_clients;
82 b0a6bcf7 2022-09-13 op volatile int proxy_inflight;
83 b0a6bcf7 2022-09-13 op uint32_t proxy_fcg_id;
84 b0a6bcf7 2022-09-13 op
85 b0a6bcf7 2022-09-13 op void
86 b0a6bcf7 2022-09-13 op proxy(struct privsep *ps, struct privsep_proc *p)
87 b0a6bcf7 2022-09-13 op {
88 b0a6bcf7 2022-09-13 op proc_run(ps, p, procs, nitems(procs), proxy_init, NULL);
89 b0a6bcf7 2022-09-13 op }
90 b0a6bcf7 2022-09-13 op
91 b0a6bcf7 2022-09-13 op void
92 b0a6bcf7 2022-09-13 op proxy_init(struct privsep *ps, struct privsep_proc *p, void *arg)
93 b0a6bcf7 2022-09-13 op {
94 b0a6bcf7 2022-09-13 op if (config_init(ps->ps_env) == -1)
95 b0a6bcf7 2022-09-13 op fatal("failed to initialize configuration");
96 b0a6bcf7 2022-09-13 op
97 b0a6bcf7 2022-09-13 op /* We use a custom shutdown callback */
98 b0a6bcf7 2022-09-13 op /* p->p_shutdown = proxy_shutdown */
99 b0a6bcf7 2022-09-13 op
100 b0a6bcf7 2022-09-13 op if (pledge("stdio recvfd unix inet dns", NULL) == -1)
101 b0a6bcf7 2022-09-13 op fatal("pledge");
102 b0a6bcf7 2022-09-13 op }
103 b0a6bcf7 2022-09-13 op
104 b0a6bcf7 2022-09-13 op int
105 b0a6bcf7 2022-09-13 op proxy_launch(struct galileo *env)
106 b0a6bcf7 2022-09-13 op {
107 b0a6bcf7 2022-09-13 op event_add(&env->sc_evsock, NULL);
108 b0a6bcf7 2022-09-13 op return (0);
109 b0a6bcf7 2022-09-13 op }
110 b0a6bcf7 2022-09-13 op
111 b0a6bcf7 2022-09-13 op void
112 40f762b2 2022-09-23 op proxy_purge(struct proxy *pr)
113 b0a6bcf7 2022-09-13 op {
114 40f762b2 2022-09-23 op free(pr);
115 b0a6bcf7 2022-09-13 op }
116 b0a6bcf7 2022-09-13 op
117 b0a6bcf7 2022-09-13 op void
118 b0a6bcf7 2022-09-13 op proxy_inflight_dec(const char *why)
119 b0a6bcf7 2022-09-13 op {
120 b0a6bcf7 2022-09-13 op proxy_inflight--;
121 b0a6bcf7 2022-09-13 op log_debug("%s: inflight decremented, now %d, %s",
122 b0a6bcf7 2022-09-13 op __func__, proxy_inflight, why);
123 b0a6bcf7 2022-09-13 op }
124 b0a6bcf7 2022-09-13 op
125 b0a6bcf7 2022-09-13 op int
126 b0a6bcf7 2022-09-13 op proxy_dispatch_parent(int fd, struct privsep_proc *p, struct imsg *imsg)
127 b0a6bcf7 2022-09-13 op {
128 b0a6bcf7 2022-09-13 op struct privsep *ps = p->p_ps;
129 b0a6bcf7 2022-09-13 op struct galileo *env = ps->ps_env;
130 b0a6bcf7 2022-09-13 op
131 b0a6bcf7 2022-09-13 op switch (imsg->hdr.type) {
132 b0a6bcf7 2022-09-13 op case IMSG_CFG_SRV:
133 afb86b2c 2022-09-23 op if (config_getproxy(env, imsg) == -1)
134 b0a6bcf7 2022-09-13 op fatal("config_getproxy");
135 b0a6bcf7 2022-09-13 op break;
136 b0a6bcf7 2022-09-13 op case IMSG_CFG_SOCK:
137 b0a6bcf7 2022-09-13 op /* XXX: improve */
138 b0a6bcf7 2022-09-13 op
139 b0a6bcf7 2022-09-13 op env->sc_sock_fd = config_getsock(env, imsg);
140 b0a6bcf7 2022-09-13 op if (env->sc_sock_fd == -1)
141 b0a6bcf7 2022-09-13 op fatal("config_getsock");
142 b0a6bcf7 2022-09-13 op
143 b0a6bcf7 2022-09-13 op event_set(&env->sc_evsock, env->sc_sock_fd,
144 ea8874f1 2022-09-13 op EV_READ | EV_PERSIST, fcgi_accept, env);
145 ea8874f1 2022-09-13 op evtimer_set(&env->sc_evpause, fcgi_accept, env);
146 b0a6bcf7 2022-09-13 op break;
147 b0a6bcf7 2022-09-13 op case IMSG_CFG_DONE:
148 40f762b2 2022-09-23 op config_getcfg(env, imsg);
149 40f762b2 2022-09-23 op proxy_launch(env);
150 b0a6bcf7 2022-09-13 op break;
151 b0a6bcf7 2022-09-13 op case IMSG_CTL_START:
152 b0a6bcf7 2022-09-13 op break;
153 40f762b2 2022-09-23 op case IMSG_CTL_RESET:
154 40f762b2 2022-09-23 op config_getreset(env, imsg);
155 40f762b2 2022-09-23 op break;
156 b0a6bcf7 2022-09-13 op default:
157 b0a6bcf7 2022-09-13 op return (-1);
158 c9dc4bc6 2022-09-13 op }
159 c9dc4bc6 2022-09-13 op
160 c9dc4bc6 2022-09-13 op return (0);
161 c9dc4bc6 2022-09-13 op }
162 c9dc4bc6 2022-09-13 op
163 c9dc4bc6 2022-09-13 op static int
164 cb05cce7 2022-11-11 op portok(const char **url, struct client *clt)
165 cb05cce7 2022-11-11 op {
166 cb05cce7 2022-11-11 op const char *u = *url;
167 cb05cce7 2022-11-11 op const char *port = clt->clt_pc->proxy_port;
168 cb05cce7 2022-11-11 op size_t len;
169 cb05cce7 2022-11-11 op
170 cb05cce7 2022-11-11 op len = strlen(port);
171 cb05cce7 2022-11-11 op
172 cb05cce7 2022-11-11 op if (*u == '\0' || *u == '/' || *u == '?' || *u == '#')
173 cb05cce7 2022-11-11 op return (1);
174 cb05cce7 2022-11-11 op if (*u != ':')
175 cb05cce7 2022-11-11 op return (0);
176 cb05cce7 2022-11-11 op u++;
177 cb05cce7 2022-11-11 op if (strncmp(u, port, len) != 0)
178 cb05cce7 2022-11-11 op return (0);
179 cb05cce7 2022-11-11 op u += len;
180 cb05cce7 2022-11-11 op if (*u != '\0' && *u != '/' && *u != '?' && *u != '#')
181 cb05cce7 2022-11-11 op return (0);
182 cb05cce7 2022-11-11 op *url = u;
183 cb05cce7 2022-11-11 op return (1);
184 cb05cce7 2022-11-11 op }
185 cb05cce7 2022-11-11 op
186 cb05cce7 2022-11-11 op int
187 cb05cce7 2022-11-11 op proxy_resurl(struct client *clt, const char *url, char *buf, size_t len)
188 cb05cce7 2022-11-11 op {
189 cb05cce7 2022-11-11 op const char *tmp;
190 cb05cce7 2022-11-11 op size_t l;
191 cb05cce7 2022-11-11 op
192 a1cf3ab5 2022-11-11 op if (clt->clt_server_name == NULL)
193 a1cf3ab5 2022-11-11 op return (-1);
194 a1cf3ab5 2022-11-11 op
195 cb05cce7 2022-11-11 op l = strlen(clt->clt_server_name);
196 cb05cce7 2022-11-11 op
197 cb05cce7 2022-11-11 op if (len == 0) {
198 cb05cce7 2022-11-11 op log_warn("%s: zero-sized buffer!", __func__);
199 cb05cce7 2022-11-11 op return (-1);
200 cb05cce7 2022-11-11 op }
201 cb05cce7 2022-11-11 op
202 cb05cce7 2022-11-11 op /* look if it's an absolute URI */
203 cb05cce7 2022-11-11 op if (strncmp(url, "//", 2) == 0) {
204 cb05cce7 2022-11-11 op tmp = url + 2;
205 cb05cce7 2022-11-11 op if (strncmp(tmp, clt->clt_server_name, l) != 0)
206 cb05cce7 2022-11-11 op goto done;
207 cb05cce7 2022-11-11 op
208 cb05cce7 2022-11-11 op tmp += l;
209 cb05cce7 2022-11-11 op if (!portok(&tmp, clt))
210 cb05cce7 2022-11-11 op goto done;
211 cb05cce7 2022-11-11 op url = tmp;
212 cb05cce7 2022-11-11 op } else if (strncmp(url, "gemini://", 9) == 0) {
213 cb05cce7 2022-11-11 op tmp = url + 9;
214 cb05cce7 2022-11-11 op if (strncmp(tmp, clt->clt_server_name, l) != 0)
215 cb05cce7 2022-11-11 op goto done;
216 cb05cce7 2022-11-11 op
217 cb05cce7 2022-11-11 op tmp += l;
218 cb05cce7 2022-11-11 op if (!portok(&tmp, clt))
219 cb05cce7 2022-11-11 op goto done;
220 cb05cce7 2022-11-11 op url = tmp;
221 cb05cce7 2022-11-11 op } else {
222 cb05cce7 2022-11-11 op tmp = url;
223 cb05cce7 2022-11-11 op while (isalpha((unsigned char)*tmp) || *tmp == '+')
224 cb05cce7 2022-11-11 op tmp++;
225 cb05cce7 2022-11-11 op if (strncmp(tmp, "://", 3) == 0)
226 cb05cce7 2022-11-11 op goto done;
227 cb05cce7 2022-11-11 op }
228 cb05cce7 2022-11-11 op
229 cb05cce7 2022-11-11 op /* maybe it's an absolute path? */
230 cb05cce7 2022-11-11 op if (*url == '\0' || *url == '/') {
231 cb05cce7 2022-11-11 op if (strlcpy(buf, clt->clt_script_name, len) >= len)
232 cb05cce7 2022-11-11 op return (-1);
233 cb05cce7 2022-11-11 op if (strlcat(buf, url + 1, len) >= len)
234 cb05cce7 2022-11-11 op return (-1);
235 cb05cce7 2022-11-11 op return (0);
236 cb05cce7 2022-11-11 op }
237 cb05cce7 2022-11-11 op
238 cb05cce7 2022-11-11 op /* otherwise, leave it as it is */
239 cb05cce7 2022-11-11 op done:
240 cb05cce7 2022-11-11 op if (strlcpy(buf, url, len) >= len)
241 cb05cce7 2022-11-11 op return (-1);
242 cb05cce7 2022-11-11 op return (0);
243 cb05cce7 2022-11-11 op }
244 cb05cce7 2022-11-11 op
245 cb05cce7 2022-11-11 op static int
246 c9dc4bc6 2022-09-13 op gemtext_translate_line(struct client *clt, char *line)
247 c9dc4bc6 2022-09-13 op {
248 cb05cce7 2022-11-11 op char buf[1025];
249 cb05cce7 2022-11-11 op char *url;
250 cb05cce7 2022-11-11 op
251 c9dc4bc6 2022-09-13 op /* preformatted line / closing */
252 b9de0a74 2022-09-14 op if (clt->clt_translate & TR_PRE) {
253 c9dc4bc6 2022-09-13 op if (!strncmp(line, "```", 3)) {
254 b9de0a74 2022-09-14 op clt->clt_translate &= ~TR_PRE;
255 ceb3f79c 2022-09-29 op return (tp_pre_close(clt->clt_tp));
256 c9dc4bc6 2022-09-13 op }
257 c9dc4bc6 2022-09-13 op
258 df2db214 2022-09-19 op if (tp_htmlescape(clt->clt_tp, line) == -1)
259 c9dc4bc6 2022-09-13 op return (-1);
260 c9dc4bc6 2022-09-13 op return (clt_putc(clt, '\n'));
261 b9de0a74 2022-09-14 op }
262 b9de0a74 2022-09-14 op
263 b9de0a74 2022-09-14 op /* bullet */
264 b9de0a74 2022-09-14 op if (!strncmp(line, "* ", 2)) {
265 b9de0a74 2022-09-14 op if (clt->clt_translate & TR_NAV) {
266 b9de0a74 2022-09-14 op if (clt_puts(clt, "</ul></nav>") == -1)
267 b9de0a74 2022-09-14 op return (-1);
268 b9de0a74 2022-09-14 op clt->clt_translate &= ~TR_NAV;
269 b9de0a74 2022-09-14 op }
270 b9de0a74 2022-09-14 op
271 b9de0a74 2022-09-14 op if (!(clt->clt_translate & TR_LIST)) {
272 b9de0a74 2022-09-14 op if (clt_puts(clt, "<ul>") == -1)
273 b9de0a74 2022-09-14 op return (-1);
274 b9de0a74 2022-09-14 op clt->clt_translate |= TR_LIST;
275 b9de0a74 2022-09-14 op }
276 b9de0a74 2022-09-14 op
277 b9de0a74 2022-09-14 op if (clt_puts(clt, "<li>") == -1 ||
278 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line + 2) == -1 ||
279 b9de0a74 2022-09-14 op clt_puts(clt, "</li>") == -1)
280 b9de0a74 2022-09-14 op return (-1);
281 b9de0a74 2022-09-14 op return (0);
282 b9de0a74 2022-09-14 op }
283 b9de0a74 2022-09-14 op
284 b9de0a74 2022-09-14 op if (clt->clt_translate & TR_LIST) {
285 b9de0a74 2022-09-14 op if (clt_puts(clt, "</ul>") == -1)
286 b9de0a74 2022-09-14 op return (-1);
287 b9de0a74 2022-09-14 op clt->clt_translate &= ~TR_LIST;
288 b9de0a74 2022-09-14 op }
289 b9de0a74 2022-09-14 op
290 cb05cce7 2022-11-11 op /* link */
291 b9de0a74 2022-09-14 op if (!strncmp(line, "=>", 2)) {
292 b9de0a74 2022-09-14 op char *label;
293 b9de0a74 2022-09-14 op
294 b9de0a74 2022-09-14 op line += 2;
295 b9de0a74 2022-09-14 op line += strspn(line, " \t");
296 b9de0a74 2022-09-14 op
297 b9de0a74 2022-09-14 op label = line + strcspn(line, " \t");
298 b9de0a74 2022-09-14 op if (*label == '\0')
299 b9de0a74 2022-09-14 op label = line;
300 cd396568 2022-11-11 op else {
301 b9de0a74 2022-09-14 op *label++ = '\0';
302 cd396568 2022-11-11 op label += strspn(label, " \t");
303 cd396568 2022-11-11 op if (*label == '\0')
304 cd396568 2022-11-11 op label = line;
305 cd396568 2022-11-11 op }
306 b9de0a74 2022-09-14 op
307 cb05cce7 2022-11-11 op if (proxy_resurl(clt, line, buf, sizeof(buf)) == 0)
308 cb05cce7 2022-11-11 op url = buf;
309 cb05cce7 2022-11-11 op else
310 cb05cce7 2022-11-11 op url = line; /* leave the URL as it is */
311 cb05cce7 2022-11-11 op
312 cb05cce7 2022-11-11 op if (fnmatch("*.jpg", url, 0) == 0 ||
313 cb05cce7 2022-11-11 op fnmatch("*.jpeg", url, 0) == 0 ||
314 cb05cce7 2022-11-11 op fnmatch("*.gif", url, 0) == 0 ||
315 cb05cce7 2022-11-11 op fnmatch("*.png", url, 0) == 0 ||
316 cb05cce7 2022-11-11 op fnmatch("*.svg", url, 0) == 0 ||
317 cb05cce7 2022-11-11 op fnmatch("*.webp", url, 0) == 0) {
318 33f4bf26 2022-09-14 op if (clt->clt_translate & TR_NAV) {
319 33f4bf26 2022-09-14 op if (clt_puts(clt, "</ul></nav>") == -1)
320 33f4bf26 2022-09-14 op return (-1);
321 33f4bf26 2022-09-14 op clt->clt_translate &= ~TR_NAV;
322 33f4bf26 2022-09-14 op }
323 33f4bf26 2022-09-14 op
324 cb05cce7 2022-11-11 op if (tp_figure(clt->clt_tp, url, label) == -1)
325 33f4bf26 2022-09-14 op return (-1);
326 33f4bf26 2022-09-14 op
327 33f4bf26 2022-09-14 op return (0);
328 33f4bf26 2022-09-14 op }
329 33f4bf26 2022-09-14 op
330 33f4bf26 2022-09-14 op if (!(clt->clt_translate & TR_NAV)) {
331 33f4bf26 2022-09-14 op if (clt_puts(clt, "<nav><ul>") == -1)
332 33f4bf26 2022-09-14 op return (-1);
333 33f4bf26 2022-09-14 op clt->clt_translate |= TR_NAV;
334 33f4bf26 2022-09-14 op }
335 33f4bf26 2022-09-14 op
336 acc266fe 2022-09-19 op if (clt_puts(clt, "<li><a href='") == -1)
337 acc266fe 2022-09-19 op return (-1);
338 acc266fe 2022-09-19 op
339 cb05cce7 2022-11-11 op if (tp_urlescape(clt->clt_tp, url) == -1 ||
340 b9de0a74 2022-09-14 op clt_puts(clt, "'>") == -1 ||
341 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, label) == -1 ||
342 b9de0a74 2022-09-14 op clt_puts(clt, "</a></li>") == -1)
343 b9de0a74 2022-09-14 op return (-1);
344 b9de0a74 2022-09-14 op
345 b9de0a74 2022-09-14 op return (0);
346 c9dc4bc6 2022-09-13 op }
347 c9dc4bc6 2022-09-13 op
348 b9de0a74 2022-09-14 op if (clt->clt_translate & TR_NAV) {
349 b9de0a74 2022-09-14 op if (clt_puts(clt, "</ul></nav>") == -1)
350 b9de0a74 2022-09-14 op return (-1);
351 b9de0a74 2022-09-14 op clt->clt_translate &= ~TR_NAV;
352 b9de0a74 2022-09-14 op }
353 b9de0a74 2022-09-14 op
354 c9dc4bc6 2022-09-13 op /* pre opening */
355 c9dc4bc6 2022-09-13 op if (!strncmp(line, "```", 3)) {
356 ceb3f79c 2022-09-29 op line += 3;
357 ceb3f79c 2022-09-29 op line += strspn(line, " \t");
358 ceb3f79c 2022-09-29 op
359 b9de0a74 2022-09-14 op clt->clt_translate |= TR_PRE;
360 ceb3f79c 2022-09-29 op return (tp_pre_open(clt->clt_tp, line));
361 c9dc4bc6 2022-09-13 op }
362 c9dc4bc6 2022-09-13 op
363 c9dc4bc6 2022-09-13 op /* citation block */
364 c9dc4bc6 2022-09-13 op if (*line == '>') {
365 c9dc4bc6 2022-09-13 op if (clt_puts(clt, "<blockquote>") == -1 ||
366 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line + 1) == -1 ||
367 c9dc4bc6 2022-09-13 op clt_puts(clt, "</blockquote>") == -1)
368 c9dc4bc6 2022-09-13 op return (-1);
369 c9dc4bc6 2022-09-13 op return (0);
370 c9dc4bc6 2022-09-13 op }
371 c9dc4bc6 2022-09-13 op
372 c9dc4bc6 2022-09-13 op /* headings */
373 c9dc4bc6 2022-09-13 op if (!strncmp(line, "###", 3)) {
374 c9dc4bc6 2022-09-13 op if (clt_puts(clt, "<h3>") == -1 ||
375 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line + 3) == -1 ||
376 c9dc4bc6 2022-09-13 op clt_puts(clt, "</h3>") == -1)
377 c9dc4bc6 2022-09-13 op return (-1);
378 c9dc4bc6 2022-09-13 op return (0);
379 c9dc4bc6 2022-09-13 op }
380 c9dc4bc6 2022-09-13 op if (!strncmp(line, "##", 2)) {
381 c9dc4bc6 2022-09-13 op if (clt_puts(clt, "<h2>") == -1 ||
382 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line + 2) == -1 ||
383 c9dc4bc6 2022-09-13 op clt_puts(clt, "</h2>") == -1)
384 c9dc4bc6 2022-09-13 op return (-1);
385 c9dc4bc6 2022-09-13 op return (0);
386 b0a6bcf7 2022-09-13 op }
387 c9dc4bc6 2022-09-13 op if (!strncmp(line, "#", 1)) {
388 c9dc4bc6 2022-09-13 op if (clt_puts(clt, "<h1>") == -1 ||
389 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line + 1) == -1 ||
390 c9dc4bc6 2022-09-13 op clt_puts(clt, "</h1>") == -1)
391 c9dc4bc6 2022-09-13 op return (-1);
392 c9dc4bc6 2022-09-13 op return (0);
393 c9dc4bc6 2022-09-13 op }
394 df5279ca 2022-09-14 op
395 df5279ca 2022-09-14 op /* Not following strictly the gemini specification... */
396 df5279ca 2022-09-14 op if (*line == '\0')
397 df5279ca 2022-09-14 op return (0);
398 b0a6bcf7 2022-09-13 op
399 c9dc4bc6 2022-09-13 op /* paragraph */
400 c9dc4bc6 2022-09-13 op if (clt_puts(clt, "<p>") == -1 ||
401 df2db214 2022-09-19 op tp_htmlescape(clt->clt_tp, line) == -1 ||
402 c9dc4bc6 2022-09-13 op clt_puts(clt, "</p>") == -1)
403 c9dc4bc6 2022-09-13 op return (-1);
404 b9de0a74 2022-09-14 op
405 b0a6bcf7 2022-09-13 op return (0);
406 b0a6bcf7 2022-09-13 op }
407 b0a6bcf7 2022-09-13 op
408 c9dc4bc6 2022-09-13 op void
409 c9dc4bc6 2022-09-13 op proxy_translate_gemtext(struct client *clt)
410 c9dc4bc6 2022-09-13 op {
411 c9dc4bc6 2022-09-13 op struct bufferevent *bev = clt->clt_bev;
412 c9dc4bc6 2022-09-13 op struct evbuffer *src = EVBUFFER_INPUT(bev);
413 c9dc4bc6 2022-09-13 op char *line;
414 c9dc4bc6 2022-09-13 op size_t len;
415 c9dc4bc6 2022-09-13 op int r;
416 c9dc4bc6 2022-09-13 op
417 c9dc4bc6 2022-09-13 op for (;;) {
418 b9de0a74 2022-09-14 op line = evbuffer_readln(src, &len, EVBUFFER_EOL_CRLF);
419 c9dc4bc6 2022-09-13 op if (line == NULL)
420 c9dc4bc6 2022-09-13 op return;
421 c9dc4bc6 2022-09-13 op
422 c9dc4bc6 2022-09-13 op r = gemtext_translate_line(clt, line);
423 c9dc4bc6 2022-09-13 op free(line);
424 c9dc4bc6 2022-09-13 op if (r == -1)
425 c9dc4bc6 2022-09-13 op return;
426 c9dc4bc6 2022-09-13 op }
427 c9dc4bc6 2022-09-13 op }
428 c9dc4bc6 2022-09-13 op
429 f774ad1e 2022-09-23 op struct proxy_config *
430 f774ad1e 2022-09-23 op proxy_match(struct galileo *env, const char *name)
431 b0a6bcf7 2022-09-13 op {
432 afb86b2c 2022-09-23 op struct proxy *pr;
433 b0a6bcf7 2022-09-13 op
434 f774ad1e 2022-09-23 op if (name == NULL)
435 c9e6d547 2022-09-23 op return (NULL);
436 b0a6bcf7 2022-09-13 op
437 afb86b2c 2022-09-23 op TAILQ_FOREACH(pr, &env->sc_proxies, pr_entry) {
438 f774ad1e 2022-09-23 op if (!strcmp(name, pr->pr_conf.host))
439 c9e6d547 2022-09-23 op return (&pr->pr_conf);
440 b0a6bcf7 2022-09-13 op }
441 b0a6bcf7 2022-09-13 op
442 c9e6d547 2022-09-23 op return (NULL);
443 b0a6bcf7 2022-09-13 op }
444 b0a6bcf7 2022-09-13 op
445 8857131d 2022-09-20 op int
446 b0a6bcf7 2022-09-13 op proxy_start_request(struct galileo *env, struct client *clt)
447 b0a6bcf7 2022-09-13 op {
448 b0a6bcf7 2022-09-13 op struct addrinfo hints;
449 b0a6bcf7 2022-09-13 op struct asr_query *query;
450 8857131d 2022-09-20 op int r;
451 26cd3e9d 2022-09-23 op char *url;
452 b0a6bcf7 2022-09-13 op
453 f33634c5 2022-09-30 op if (clt->clt_path_info == NULL) {
454 f33634c5 2022-09-30 op log_warnx("PATH_INFO not defined!");
455 f33634c5 2022-09-30 op if (proxy_start_reply(clt, 501, "text/html") == -1)
456 f33634c5 2022-09-30 op return (-1);
457 056e82d3 2022-09-30 op if (tp_error(clt->clt_tp, -1, "internal server error") == -1)
458 f33634c5 2022-09-30 op return (-1);
459 f33634c5 2022-09-30 op return (fcgi_end_request(clt, 1));
460 f33634c5 2022-09-30 op }
461 f33634c5 2022-09-30 op
462 f774ad1e 2022-09-23 op if ((clt->clt_pc = proxy_match(env, clt->clt_server_name)) == NULL) {
463 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
464 8857131d 2022-09-20 op return (-1);
465 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, -1, "unknown server") == -1)
466 8857131d 2022-09-20 op return (-1);
467 8857131d 2022-09-20 op return (fcgi_end_request(clt, 1));
468 8857131d 2022-09-20 op }
469 8857131d 2022-09-20 op
470 8857131d 2022-09-20 op if (clt->clt_bodylen != 0 && clt->clt_body == NULL) {
471 8857131d 2022-09-20 op if (proxy_start_reply(clt, 400, "text/html") == -1)
472 8857131d 2022-09-20 op return (-1);
473 8857131d 2022-09-20 op if (tp_error(clt->clt_tp, -1, "bad request") == -1)
474 8857131d 2022-09-20 op return (-1);
475 8857131d 2022-09-20 op return (fcgi_end_request(clt, 1));
476 b0a6bcf7 2022-09-13 op }
477 b0a6bcf7 2022-09-13 op
478 8857131d 2022-09-20 op if (clt->clt_body) {
479 8857131d 2022-09-20 op r = asprintf(&url, "%s%s?%s", clt->clt_script_name,
480 8857131d 2022-09-20 op clt->clt_path_info + 1, clt->clt_body);
481 8857131d 2022-09-20 op if (r == -1)
482 8857131d 2022-09-20 op return (fcgi_end_request(clt, 1));
483 8857131d 2022-09-20 op
484 8857131d 2022-09-20 op if (proxy_start_reply(clt, 302, url) == -1 ||
485 8857131d 2022-09-20 op fcgi_end_request(clt, 1) == -1) {
486 8857131d 2022-09-20 op free(url);
487 8857131d 2022-09-20 op return (-1);
488 8857131d 2022-09-20 op }
489 8857131d 2022-09-20 op free(url);
490 8857131d 2022-09-20 op return (0);
491 8857131d 2022-09-20 op }
492 8857131d 2022-09-20 op
493 b0a6bcf7 2022-09-13 op memset(&hints, 0, sizeof(hints));
494 b0a6bcf7 2022-09-13 op hints.ai_family = AF_UNSPEC;
495 b0a6bcf7 2022-09-13 op hints.ai_socktype = SOCK_STREAM;
496 b0a6bcf7 2022-09-13 op
497 26cd3e9d 2022-09-23 op query = getaddrinfo_async(clt->clt_pc->proxy_addr,
498 26cd3e9d 2022-09-23 op clt->clt_pc->proxy_port, &hints, NULL);
499 b0a6bcf7 2022-09-13 op if (query == NULL) {
500 b0a6bcf7 2022-09-13 op log_warn("getaddrinfo_async");
501 8857131d 2022-09-20 op return (fcgi_abort_request(clt));
502 b0a6bcf7 2022-09-13 op }
503 b0a6bcf7 2022-09-13 op
504 b0a6bcf7 2022-09-13 op clt->clt_evasr = event_asr_run(query, proxy_resolved, clt);
505 b0a6bcf7 2022-09-13 op if (clt->clt_evasr == NULL) {
506 b0a6bcf7 2022-09-13 op log_warn("event_asr_run");
507 b0a6bcf7 2022-09-13 op asr_abort(query);
508 8857131d 2022-09-20 op return (fcgi_abort_request(clt));
509 b0a6bcf7 2022-09-13 op }
510 8857131d 2022-09-20 op
511 8857131d 2022-09-20 op return (0);
512 b0a6bcf7 2022-09-13 op }
513 b0a6bcf7 2022-09-13 op
514 b0a6bcf7 2022-09-13 op void
515 b0a6bcf7 2022-09-13 op proxy_resolved(struct asr_result *res, void *d)
516 b0a6bcf7 2022-09-13 op {
517 b0a6bcf7 2022-09-13 op struct client *clt = d;
518 b0a6bcf7 2022-09-13 op struct proxy_config *pc = clt->clt_pc;
519 b0a6bcf7 2022-09-13 op
520 b0a6bcf7 2022-09-13 op clt->clt_evasr = NULL;
521 b0a6bcf7 2022-09-13 op
522 b0a6bcf7 2022-09-13 op if (res->ar_gai_errno != 0) {
523 26cd3e9d 2022-09-23 op log_warnx("failed to resolve %s:%s: %s",
524 b0a6bcf7 2022-09-13 op pc->proxy_addr, pc->proxy_port,
525 b0a6bcf7 2022-09-13 op gai_strerror(res->ar_gai_errno));
526 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
527 b0a6bcf7 2022-09-13 op return;
528 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, -1, "Can't resolve host") == -1)
529 b0a6bcf7 2022-09-13 op return;
530 b0a6bcf7 2022-09-13 op fcgi_end_request(clt, 1);
531 b0a6bcf7 2022-09-13 op return;
532 b0a6bcf7 2022-09-13 op }
533 b0a6bcf7 2022-09-13 op
534 b0a6bcf7 2022-09-13 op clt->clt_addrinfo = res->ar_addrinfo;
535 b0a6bcf7 2022-09-13 op clt->clt_p = clt->clt_addrinfo;
536 b0a6bcf7 2022-09-13 op proxy_connect(-1, 0, clt);
537 b0a6bcf7 2022-09-13 op }
538 b0a6bcf7 2022-09-13 op
539 b0a6bcf7 2022-09-13 op void
540 b0a6bcf7 2022-09-13 op proxy_connect(int fd, short ev, void *d)
541 b0a6bcf7 2022-09-13 op {
542 b0a6bcf7 2022-09-13 op struct client *clt = d;
543 b0a6bcf7 2022-09-13 op struct evbuffer *out;
544 b0a6bcf7 2022-09-13 op struct addrinfo *p;
545 b0a6bcf7 2022-09-13 op struct tls_config *conf;
546 b0a6bcf7 2022-09-13 op struct timeval conntv = {5, 0};
547 b0a6bcf7 2022-09-13 op int err = 0;
548 b0a6bcf7 2022-09-13 op socklen_t len = sizeof(err);
549 b0a6bcf7 2022-09-13 op
550 b0a6bcf7 2022-09-13 op again:
551 b0a6bcf7 2022-09-13 op if (clt->clt_p == NULL)
552 b0a6bcf7 2022-09-13 op goto err;
553 b0a6bcf7 2022-09-13 op
554 b0a6bcf7 2022-09-13 op if (clt->clt_fd != -1) {
555 b0a6bcf7 2022-09-13 op if (getsockopt(clt->clt_fd, SOL_SOCKET, SO_ERROR, &err, &len)
556 b0a6bcf7 2022-09-13 op == -1)
557 b0a6bcf7 2022-09-13 op goto err;
558 b0a6bcf7 2022-09-13 op if (err != 0) {
559 b0a6bcf7 2022-09-13 op errno = err;
560 b0a6bcf7 2022-09-13 op goto err;
561 b0a6bcf7 2022-09-13 op }
562 b0a6bcf7 2022-09-13 op goto done;
563 b0a6bcf7 2022-09-13 op }
564 b0a6bcf7 2022-09-13 op
565 b0a6bcf7 2022-09-13 op p = clt->clt_p;
566 b0a6bcf7 2022-09-13 op clt->clt_fd = socket(p->ai_family, p->ai_socktype | SOCK_NONBLOCK,
567 b0a6bcf7 2022-09-13 op p->ai_protocol);
568 b0a6bcf7 2022-09-13 op if (clt->clt_fd == -1) {
569 b0a6bcf7 2022-09-13 op clt->clt_p = clt->clt_p->ai_next;
570 b0a6bcf7 2022-09-13 op goto again;
571 b0a6bcf7 2022-09-13 op }
572 b0a6bcf7 2022-09-13 op
573 b0a6bcf7 2022-09-13 op if (connect(clt->clt_fd, p->ai_addr, p->ai_addrlen) == 0)
574 b0a6bcf7 2022-09-13 op goto done;
575 b0a6bcf7 2022-09-13 op
576 b0a6bcf7 2022-09-13 op clt->clt_evconn_live = 1;
577 b0a6bcf7 2022-09-13 op event_set(&clt->clt_evconn, clt->clt_fd, EV_WRITE, proxy_connect, clt);
578 b0a6bcf7 2022-09-13 op event_add(&clt->clt_evconn, &conntv);
579 b0a6bcf7 2022-09-13 op return;
580 b0a6bcf7 2022-09-13 op
581 b0a6bcf7 2022-09-13 op done:
582 b0a6bcf7 2022-09-13 op clt->clt_evconn_live = 0;
583 b0a6bcf7 2022-09-13 op freeaddrinfo(clt->clt_addrinfo);
584 b0a6bcf7 2022-09-13 op clt->clt_addrinfo = clt->clt_p = NULL;
585 b0a6bcf7 2022-09-13 op
586 c743c9a1 2022-09-23 op clt->clt_bev = bufferevent_new(clt->clt_fd, proxy_read, proxy_write,
587 c743c9a1 2022-09-23 op proxy_error, clt);
588 c743c9a1 2022-09-23 op if (clt->clt_bev == NULL) {
589 c743c9a1 2022-09-23 op log_warn("bufferevent_new");
590 b0a6bcf7 2022-09-13 op goto err;
591 b0a6bcf7 2022-09-13 op }
592 b0a6bcf7 2022-09-13 op
593 c743c9a1 2022-09-23 op if (!clt->clt_pc->no_tls) {
594 c743c9a1 2022-09-23 op /* initialize TLS for Gemini */
595 c743c9a1 2022-09-23 op if ((conf = tls_config_new()) == NULL) {
596 c743c9a1 2022-09-23 op log_warn("tls_config_new failed");
597 c743c9a1 2022-09-23 op goto err;
598 c743c9a1 2022-09-23 op }
599 b0a6bcf7 2022-09-13 op
600 c743c9a1 2022-09-23 op tls_config_insecure_noverifycert(conf);
601 b0a6bcf7 2022-09-13 op
602 c743c9a1 2022-09-23 op if ((clt->clt_ctx = tls_client()) == NULL) {
603 c743c9a1 2022-09-23 op log_warnx("tls_client failed");
604 c743c9a1 2022-09-23 op tls_config_free(conf);
605 c743c9a1 2022-09-23 op goto err;
606 c743c9a1 2022-09-23 op }
607 c743c9a1 2022-09-23 op
608 c743c9a1 2022-09-23 op if (tls_configure(clt->clt_ctx, conf) == -1) {
609 c743c9a1 2022-09-23 op log_warnx("tls_configure failed");
610 c743c9a1 2022-09-23 op tls_config_free(conf);
611 c743c9a1 2022-09-23 op goto err;
612 c743c9a1 2022-09-23 op }
613 b0a6bcf7 2022-09-13 op
614 c743c9a1 2022-09-23 op tls_config_free(conf);
615 b0a6bcf7 2022-09-13 op
616 c743c9a1 2022-09-23 op if (tls_connect_socket(clt->clt_ctx, clt->clt_fd,
617 c743c9a1 2022-09-23 op clt->clt_pc->proxy_name) == -1) {
618 c743c9a1 2022-09-23 op log_warnx("tls_connect_socket failed");
619 c743c9a1 2022-09-23 op goto err;
620 c743c9a1 2022-09-23 op }
621 b0a6bcf7 2022-09-13 op
622 c743c9a1 2022-09-23 op event_set(&clt->clt_bev->ev_read, clt->clt_fd, EV_READ,
623 c743c9a1 2022-09-23 op proxy_tls_readcb, clt->clt_bev);
624 c743c9a1 2022-09-23 op event_set(&clt->clt_bev->ev_write, clt->clt_fd, EV_WRITE,
625 c743c9a1 2022-09-23 op proxy_tls_writecb, clt->clt_bev);
626 83f0f95a 2022-09-29 op
627 83f0f95a 2022-09-29 op #if HAVE_LIBEVENT2
628 83f0f95a 2022-09-29 op evbuffer_unfreeze(clt->clt_bev->input, 0);
629 83f0f95a 2022-09-29 op evbuffer_unfreeze(clt->clt_bev->output, 1);
630 83f0f95a 2022-09-29 op #endif
631 c743c9a1 2022-09-23 op }
632 b0a6bcf7 2022-09-13 op
633 b0a6bcf7 2022-09-13 op /* bufferevent_settimeout(); */
634 b0a6bcf7 2022-09-13 op bufferevent_enable(clt->clt_bev, EV_READ|EV_WRITE);
635 b0a6bcf7 2022-09-13 op
636 b0a6bcf7 2022-09-13 op /* TODO: compute the URL */
637 c743c9a1 2022-09-23 op out = EVBUFFER_OUTPUT(clt->clt_bev);
638 28239bac 2022-09-20 op if (evbuffer_add_printf(out, "gemini://%s/%s",
639 ee80262d 2022-09-13 op clt->clt_pc->proxy_name, clt->clt_path_info) == -1) {
640 28239bac 2022-09-20 op log_warn("bufferevent_printf failed");
641 28239bac 2022-09-20 op goto err;
642 28239bac 2022-09-20 op }
643 28239bac 2022-09-20 op
644 28239bac 2022-09-20 op if (clt->clt_query &&
645 28239bac 2022-09-20 op evbuffer_add_printf(out, "?%s", clt->clt_query) == -1) {
646 b0a6bcf7 2022-09-13 op log_warn("bufferevent_printf failed");
647 28239bac 2022-09-20 op goto err;
648 28239bac 2022-09-20 op }
649 28239bac 2022-09-20 op
650 28239bac 2022-09-20 op if (evbuffer_add(out, "\r\n", 2) == -1) {
651 28239bac 2022-09-20 op log_warn("bufferevent_add failed");
652 b0a6bcf7 2022-09-13 op goto err;
653 b0a6bcf7 2022-09-13 op }
654 b0a6bcf7 2022-09-13 op
655 b0a6bcf7 2022-09-13 op return;
656 b0a6bcf7 2022-09-13 op
657 b0a6bcf7 2022-09-13 op err:
658 26cd3e9d 2022-09-23 op log_warn("failed to connect to %s:%s",
659 b0a6bcf7 2022-09-13 op clt->clt_pc->proxy_addr, clt->clt_pc->proxy_port);
660 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
661 b0a6bcf7 2022-09-13 op return;
662 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, -1, "Can't connect") == -1)
663 b0a6bcf7 2022-09-13 op return;
664 b0a6bcf7 2022-09-13 op fcgi_end_request(clt, 1);
665 6edd9a00 2022-09-14 op }
666 6edd9a00 2022-09-14 op
667 6edd9a00 2022-09-14 op static inline int
668 6edd9a00 2022-09-14 op parse_mime(struct client *clt, char *mime, char *lang, size_t len)
669 6edd9a00 2022-09-14 op {
670 6edd9a00 2022-09-14 op char *t, *semi;
671 6edd9a00 2022-09-14 op
672 6edd9a00 2022-09-14 op if (strncmp(mime, "text/gemini", 11) != 0)
673 6edd9a00 2022-09-14 op return (0);
674 6edd9a00 2022-09-14 op
675 6edd9a00 2022-09-14 op clt->clt_translate = TR_ENABLED;
676 6edd9a00 2022-09-14 op
677 6edd9a00 2022-09-14 op if ((mime = strchr(mime, ';')) == NULL)
678 6edd9a00 2022-09-14 op return (0);
679 6edd9a00 2022-09-14 op
680 6edd9a00 2022-09-14 op *mime++ = '\0';
681 6edd9a00 2022-09-14 op while ((t = strsep(&mime, ";")) != NULL) {
682 6edd9a00 2022-09-14 op if (!strncmp(t, "charset=", 8)) {
683 6edd9a00 2022-09-14 op t += 8;
684 6edd9a00 2022-09-14 op if (!strncasecmp(t, "utf8", 4) ||
685 8ab2d60e 2022-09-14 op !strncasecmp(t, "utf-8", 5) ||
686 6edd9a00 2022-09-14 op !strncasecmp(t, "ascii", 5)) {
687 6edd9a00 2022-09-14 op log_debug("unknown charset %s", t);
688 6edd9a00 2022-09-14 op return (-1);
689 6edd9a00 2022-09-14 op }
690 6edd9a00 2022-09-14 op continue;
691 6edd9a00 2022-09-14 op }
692 6edd9a00 2022-09-14 op
693 6edd9a00 2022-09-14 op if (!strncmp(t, "lang=", 5)) {
694 6edd9a00 2022-09-14 op t += 5;
695 6edd9a00 2022-09-14 op if ((semi = strchr(t, ';')) != NULL)
696 6edd9a00 2022-09-14 op *semi = '\0';
697 6edd9a00 2022-09-14 op
698 6edd9a00 2022-09-14 op if (strlcpy(lang, t, len) >= len) {
699 6edd9a00 2022-09-14 op log_debug("lang too long: %s", t);
700 6edd9a00 2022-09-14 op *lang = '\0';
701 6edd9a00 2022-09-14 op }
702 6edd9a00 2022-09-14 op
703 6edd9a00 2022-09-14 op if (semi)
704 6edd9a00 2022-09-14 op *semi = ';';
705 6edd9a00 2022-09-14 op continue;
706 6edd9a00 2022-09-14 op }
707 bff58270 2022-09-19 op }
708 bff58270 2022-09-19 op
709 6edd9a00 2022-09-14 op return (0);
710 b0a6bcf7 2022-09-13 op }
711 5163fbe9 2022-09-20 op
712 5163fbe9 2022-09-20 op int
713 5163fbe9 2022-09-20 op proxy_start_reply(struct client *clt, int status, const char *ctype)
714 5163fbe9 2022-09-20 op {
715 5163fbe9 2022-09-20 op const char *csp;
716 b0a6bcf7 2022-09-13 op
717 5163fbe9 2022-09-20 op csp = "Content-Security-Policy: default-src 'self'; "
718 5163fbe9 2022-09-20 op "script-src 'none'; object-src 'none';\r\n";
719 5163fbe9 2022-09-20 op
720 5163fbe9 2022-09-20 op if (status != 200 &&
721 2df73ca5 2022-09-20 op clt_printf(clt, "Status: %d\r\n", status) == -1)
722 5163fbe9 2022-09-20 op return (-1);
723 5163fbe9 2022-09-20 op
724 2df73ca5 2022-09-20 op if (clt_puts(clt, csp) == -1)
725 5163fbe9 2022-09-20 op return (-1);
726 8857131d 2022-09-20 op
727 8857131d 2022-09-20 op if (status == 302) {
728 8857131d 2022-09-20 op /* use "ctype" as redirect target */
729 8857131d 2022-09-20 op if (clt_printf(clt, "Location: %s\r\n", ctype) == -1)
730 8857131d 2022-09-20 op return (-1);
731 8857131d 2022-09-20 op if (clt_puts(clt, "\r\n") == -1)
732 8857131d 2022-09-20 op return (-1);
733 8857131d 2022-09-20 op return (0);
734 8857131d 2022-09-20 op }
735 5163fbe9 2022-09-20 op
736 8857131d 2022-09-20 op if (ctype != NULL) {
737 8857131d 2022-09-20 op if (!strcmp(ctype, "text/html"))
738 8857131d 2022-09-20 op ctype = "text/html;charset=utf-8";
739 8857131d 2022-09-20 op if (clt_printf(clt, "Content-Type: %s\r\n", ctype)
740 8857131d 2022-09-20 op == -1)
741 8857131d 2022-09-20 op return (-1);
742 8857131d 2022-09-20 op }
743 8857131d 2022-09-20 op
744 5163fbe9 2022-09-20 op if (clt_puts(clt, "\r\n") == -1)
745 5163fbe9 2022-09-20 op return (-1);
746 5163fbe9 2022-09-20 op
747 5163fbe9 2022-09-20 op return (0);
748 5163fbe9 2022-09-20 op }
749 5163fbe9 2022-09-20 op
750 b0a6bcf7 2022-09-13 op void
751 b0a6bcf7 2022-09-13 op proxy_read(struct bufferevent *bev, void *d)
752 b0a6bcf7 2022-09-13 op {
753 b0a6bcf7 2022-09-13 op struct client *clt = d;
754 b0a6bcf7 2022-09-13 op struct evbuffer *src = EVBUFFER_INPUT(bev);
755 c9dc4bc6 2022-09-13 op const char *ctype;
756 cb05cce7 2022-11-11 op char buf[1025];
757 6edd9a00 2022-09-14 op char lang[16];
758 6edd9a00 2022-09-14 op char *hdr, *mime;
759 b0a6bcf7 2022-09-13 op size_t len;
760 abe17781 2022-09-20 op int code;
761 b0a6bcf7 2022-09-13 op
762 b0a6bcf7 2022-09-13 op if (clt->clt_headersdone) {
763 c9dc4bc6 2022-09-13 op if (clt->clt_translate)
764 c9dc4bc6 2022-09-13 op proxy_translate_gemtext(clt);
765 c9dc4bc6 2022-09-13 op else
766 c9dc4bc6 2022-09-13 op clt_write_bufferevent(clt, bev);
767 b0a6bcf7 2022-09-13 op return;
768 b0a6bcf7 2022-09-13 op }
769 b0a6bcf7 2022-09-13 op
770 b0a6bcf7 2022-09-13 op hdr = evbuffer_readln(src, &len, EVBUFFER_EOL_CRLF_STRICT);
771 b0a6bcf7 2022-09-13 op if (hdr == NULL) {
772 b0a6bcf7 2022-09-13 op if (EVBUFFER_LENGTH(src) >= 1026)
773 b0a6bcf7 2022-09-13 op proxy_error(bev, EV_READ, clt);
774 b0a6bcf7 2022-09-13 op return;
775 b0a6bcf7 2022-09-13 op }
776 b0a6bcf7 2022-09-13 op
777 b0a6bcf7 2022-09-13 op if (len < 4 ||
778 b0a6bcf7 2022-09-13 op !isdigit((unsigned char)hdr[0]) ||
779 b0a6bcf7 2022-09-13 op !isdigit((unsigned char)hdr[1]) ||
780 b0a6bcf7 2022-09-13 op hdr[2] != ' ') {
781 b0a6bcf7 2022-09-13 op log_warnx("invalid ");
782 b0a6bcf7 2022-09-13 op proxy_error(bev, EV_READ, clt);
783 1337dc2b 2022-09-14 op goto err;
784 b0a6bcf7 2022-09-13 op }
785 b0a6bcf7 2022-09-13 op
786 abe17781 2022-09-20 op code = (hdr[0] - '0') * 10 + (hdr[1] - '0');
787 abe17781 2022-09-20 op
788 6e8f426e 2022-09-14 op switch (hdr[0]) {
789 8857131d 2022-09-20 op case '1':
790 8857131d 2022-09-20 op if (proxy_start_reply(clt, 200, "text/html") == -1)
791 8857131d 2022-09-20 op goto err;
792 8857131d 2022-09-20 op if (tp_inputpage(clt->clt_tp, &hdr[3]) == -1)
793 8857131d 2022-09-20 op goto err;
794 8857131d 2022-09-20 op fcgi_end_request(clt, 0);
795 8857131d 2022-09-20 op goto err;
796 6e8f426e 2022-09-14 op case '2':
797 6e8f426e 2022-09-14 op /* handled below */
798 6e8f426e 2022-09-14 op break;
799 b4f7fe4f 2022-09-21 op case '3':
800 cb05cce7 2022-11-11 op if (proxy_resurl(clt, &hdr[3], buf, sizeof(buf)) == 0) {
801 cb05cce7 2022-11-11 op if (proxy_start_reply(clt, 302, buf) == -1)
802 b4f7fe4f 2022-09-21 op goto err;
803 b4f7fe4f 2022-09-21 op fcgi_end_request(clt, 0);
804 b4f7fe4f 2022-09-21 op goto err;
805 b4f7fe4f 2022-09-21 op }
806 02be3606 2022-09-29 op /* fallthrough */
807 6e8f426e 2022-09-14 op default:
808 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
809 1337dc2b 2022-09-14 op goto err;
810 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, code, &hdr[3]) == -1)
811 1337dc2b 2022-09-14 op goto err;
812 6e8f426e 2022-09-14 op fcgi_end_request(clt, 1);
813 1337dc2b 2022-09-14 op goto err;
814 b0a6bcf7 2022-09-13 op }
815 b0a6bcf7 2022-09-13 op
816 6edd9a00 2022-09-14 op mime = hdr + 2 + strspn(hdr + 2, " \t");
817 6edd9a00 2022-09-14 op if (parse_mime(clt, mime, lang, sizeof(lang)) == -1) {
818 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
819 1337dc2b 2022-09-14 op goto err;
820 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, -1, "Bad response") == -1)
821 e3c1cbab 2022-09-20 op goto err;
822 6edd9a00 2022-09-14 op fcgi_end_request(clt, 1);
823 1337dc2b 2022-09-14 op goto err;
824 6edd9a00 2022-09-14 op }
825 bff58270 2022-09-19 op
826 232eee45 2022-09-20 op if (clt->clt_translate)
827 8ab2d60e 2022-09-14 op ctype = "text/html;charset=utf-8";
828 232eee45 2022-09-20 op else
829 6edd9a00 2022-09-14 op ctype = mime;
830 6edd9a00 2022-09-14 op
831 6edd9a00 2022-09-14 op if (clt_printf(clt, "Content-Type: %s\r\n\r\n", ctype) == -1)
832 1337dc2b 2022-09-14 op goto err;
833 b0a6bcf7 2022-09-13 op
834 b0a6bcf7 2022-09-13 op clt->clt_headersdone = 1;
835 c9dc4bc6 2022-09-13 op
836 bff58270 2022-09-19 op if (clt->clt_translate &&
837 e3c1cbab 2022-09-20 op tp_head(clt->clt_tp, lang, NULL) == -1)
838 bff58270 2022-09-19 op goto err;
839 c9dc4bc6 2022-09-13 op
840 1337dc2b 2022-09-14 op /*
841 1337dc2b 2022-09-14 op * Trigger the read again so we proceed with the response
842 1337dc2b 2022-09-14 op * body, if any.
843 1337dc2b 2022-09-14 op */
844 1337dc2b 2022-09-14 op free(hdr);
845 1337dc2b 2022-09-14 op proxy_read(bev, d);
846 1337dc2b 2022-09-14 op return;
847 1337dc2b 2022-09-14 op
848 1337dc2b 2022-09-14 op err:
849 1337dc2b 2022-09-14 op free(hdr);
850 b0a6bcf7 2022-09-13 op }
851 b0a6bcf7 2022-09-13 op
852 b0a6bcf7 2022-09-13 op void
853 b0a6bcf7 2022-09-13 op proxy_write(struct bufferevent *bev, void *d)
854 b0a6bcf7 2022-09-13 op {
855 b0a6bcf7 2022-09-13 op return;
856 b0a6bcf7 2022-09-13 op }
857 b0a6bcf7 2022-09-13 op
858 b0a6bcf7 2022-09-13 op void
859 b0a6bcf7 2022-09-13 op proxy_error(struct bufferevent *bev, short err, void *d)
860 b0a6bcf7 2022-09-13 op {
861 b0a6bcf7 2022-09-13 op struct client *clt = d;
862 b0a6bcf7 2022-09-13 op int status = !(err & EVBUFFER_EOF);
863 b0a6bcf7 2022-09-13 op
864 b0a6bcf7 2022-09-13 op log_debug("proxy error, shutting down the connection (err: %x)",
865 b0a6bcf7 2022-09-13 op err);
866 b0a6bcf7 2022-09-13 op
867 b0a6bcf7 2022-09-13 op if (!clt->clt_headersdone) {
868 e3c1cbab 2022-09-20 op if (proxy_start_reply(clt, 501, "text/html") == -1)
869 b0a6bcf7 2022-09-13 op return;
870 abe17781 2022-09-20 op if (tp_error(clt->clt_tp, -1, "Proxy error") == -1)
871 b0a6bcf7 2022-09-13 op return;
872 c9dc4bc6 2022-09-13 op } else if (status == 0) {
873 c42fce9b 2022-09-14 op if (clt->clt_translate & TR_PRE) {
874 ceb3f79c 2022-09-29 op if (tp_pre_close(clt->clt_tp))
875 c42fce9b 2022-09-14 op return;
876 c42fce9b 2022-09-14 op clt->clt_translate &= ~TR_PRE;
877 c42fce9b 2022-09-14 op }
878 c42fce9b 2022-09-14 op
879 c42fce9b 2022-09-14 op if (clt->clt_translate & TR_LIST) {
880 c42fce9b 2022-09-14 op if (clt_puts(clt, "</ul>") == -1)
881 c42fce9b 2022-09-14 op return;
882 c42fce9b 2022-09-14 op clt->clt_translate &= ~TR_LIST;
883 c42fce9b 2022-09-14 op }
884 c42fce9b 2022-09-14 op
885 c42fce9b 2022-09-14 op if (clt->clt_translate & TR_NAV) {
886 c42fce9b 2022-09-14 op if (clt_puts(clt, "</ul></nav>") == -1)
887 c42fce9b 2022-09-14 op return;
888 c42fce9b 2022-09-14 op clt->clt_translate &= ~TR_NAV;
889 c42fce9b 2022-09-14 op }
890 c42fce9b 2022-09-14 op
891 54acddc9 2022-09-19 op if (clt->clt_translate &&
892 54acddc9 2022-09-19 op tp_foot(clt->clt_tp) == -1)
893 8fa3006a 2022-09-14 op return;
894 b0a6bcf7 2022-09-13 op }
895 b0a6bcf7 2022-09-13 op
896 b0a6bcf7 2022-09-13 op fcgi_end_request(clt, status);
897 b0a6bcf7 2022-09-13 op }
898 b0a6bcf7 2022-09-13 op
899 b0a6bcf7 2022-09-13 op void
900 b0a6bcf7 2022-09-13 op proxy_tls_readcb(int fd, short event, void *arg)
901 b0a6bcf7 2022-09-13 op {
902 b0a6bcf7 2022-09-13 op struct bufferevent *bufev = arg;
903 b0a6bcf7 2022-09-13 op struct client *clt = bufev->cbarg;
904 b0a6bcf7 2022-09-13 op char rbuf[IBUF_READ_SIZE];
905 b0a6bcf7 2022-09-13 op int what = EVBUFFER_READ;
906 b0a6bcf7 2022-09-13 op int howmuch = IBUF_READ_SIZE;
907 b0a6bcf7 2022-09-13 op ssize_t ret;
908 b0a6bcf7 2022-09-13 op size_t len;
909 b0a6bcf7 2022-09-13 op
910 b0a6bcf7 2022-09-13 op if (event == EV_TIMEOUT) {
911 b0a6bcf7 2022-09-13 op what |= EVBUFFER_TIMEOUT;
912 b0a6bcf7 2022-09-13 op goto err;
913 b0a6bcf7 2022-09-13 op }
914 b0a6bcf7 2022-09-13 op
915 b0a6bcf7 2022-09-13 op if (bufev->wm_read.high != 0)
916 b0a6bcf7 2022-09-13 op howmuch = MINIMUM(sizeof(rbuf), bufev->wm_read.high);
917 b0a6bcf7 2022-09-13 op
918 b0a6bcf7 2022-09-13 op ret = tls_read(clt->clt_ctx, rbuf, howmuch);
919 b0a6bcf7 2022-09-13 op if (ret == TLS_WANT_POLLIN || ret == TLS_WANT_POLLOUT) {
920 b0a6bcf7 2022-09-13 op goto retry;
921 b0a6bcf7 2022-09-13 op } else if (ret == -1) {
922 b0a6bcf7 2022-09-13 op what |= EVBUFFER_ERROR;
923 b0a6bcf7 2022-09-13 op goto err;
924 b0a6bcf7 2022-09-13 op }
925 b0a6bcf7 2022-09-13 op len = ret;
926 b0a6bcf7 2022-09-13 op
927 b0a6bcf7 2022-09-13 op if (len == 0) {
928 b0a6bcf7 2022-09-13 op what |= EVBUFFER_EOF;
929 b0a6bcf7 2022-09-13 op goto err;
930 b0a6bcf7 2022-09-13 op }
931 b0a6bcf7 2022-09-13 op
932 b0a6bcf7 2022-09-13 op if (evbuffer_add(bufev->input, rbuf, len) == -1) {
933 b0a6bcf7 2022-09-13 op what |= EVBUFFER_ERROR;
934 b0a6bcf7 2022-09-13 op goto err;
935 b0a6bcf7 2022-09-13 op }
936 b0a6bcf7 2022-09-13 op
937 83f0f95a 2022-09-29 op proxy_bufferevent_add(&bufev->ev_read, G_TOUT(bufev->timeout_read));
938 b0a6bcf7 2022-09-13 op
939 b0a6bcf7 2022-09-13 op len = EVBUFFER_LENGTH(bufev->input);
940 b0a6bcf7 2022-09-13 op if (bufev->wm_read.low != 0 && len < bufev->wm_read.low)
941 b0a6bcf7 2022-09-13 op return;
942 b0a6bcf7 2022-09-13 op if (bufev->wm_read.high != 0 && len > bufev->wm_read.high) {
943 b0a6bcf7 2022-09-13 op struct evbuffer *buf = bufev->input;
944 b0a6bcf7 2022-09-13 op event_del(&bufev->ev_read);
945 b0a6bcf7 2022-09-13 op evbuffer_setcb(buf, bufferevent_read_pressure_cb, bufev);
946 b0a6bcf7 2022-09-13 op return;
947 b0a6bcf7 2022-09-13 op }
948 b0a6bcf7 2022-09-13 op
949 b0a6bcf7 2022-09-13 op if (bufev->readcb != NULL)
950 b0a6bcf7 2022-09-13 op (*bufev->readcb)(bufev, bufev->cbarg);
951 b0a6bcf7 2022-09-13 op return;
952 b0a6bcf7 2022-09-13 op
953 b0a6bcf7 2022-09-13 op retry:
954 83f0f95a 2022-09-29 op proxy_bufferevent_add(&bufev->ev_read, G_TOUT(bufev->timeout_read));
955 b0a6bcf7 2022-09-13 op return;
956 b0a6bcf7 2022-09-13 op
957 b0a6bcf7 2022-09-13 op err:
958 b0a6bcf7 2022-09-13 op (*bufev->errorcb)(bufev, what, bufev->cbarg);
959 b0a6bcf7 2022-09-13 op }
960 b0a6bcf7 2022-09-13 op
961 b0a6bcf7 2022-09-13 op int
962 b0a6bcf7 2022-09-13 op proxy_bufferevent_add(struct event *ev, int timeout)
963 b0a6bcf7 2022-09-13 op {
964 b0a6bcf7 2022-09-13 op struct timeval tv, *ptv = NULL;
965 b0a6bcf7 2022-09-13 op
966 b0a6bcf7 2022-09-13 op if (timeout) {
967 b0a6bcf7 2022-09-13 op timerclear(&tv);
968 b0a6bcf7 2022-09-13 op tv.tv_sec = timeout;
969 b0a6bcf7 2022-09-13 op ptv = &tv;
970 b0a6bcf7 2022-09-13 op }
971 b0a6bcf7 2022-09-13 op
972 b0a6bcf7 2022-09-13 op return (event_add(ev, ptv));
973 b0a6bcf7 2022-09-13 op }
974 b0a6bcf7 2022-09-13 op
975 b0a6bcf7 2022-09-13 op void
976 b0a6bcf7 2022-09-13 op proxy_tls_writecb(int fd, short event, void *arg)
977 b0a6bcf7 2022-09-13 op {
978 b0a6bcf7 2022-09-13 op struct bufferevent *bufev = arg;
979 b0a6bcf7 2022-09-13 op struct client *clt = bufev->cbarg;
980 b0a6bcf7 2022-09-13 op ssize_t ret;
981 b0a6bcf7 2022-09-13 op short what = EVBUFFER_WRITE;
982 b0a6bcf7 2022-09-13 op size_t len;
983 b0a6bcf7 2022-09-13 op
984 b0a6bcf7 2022-09-13 op if (event == EV_TIMEOUT) {
985 b0a6bcf7 2022-09-13 op what |= EVBUFFER_TIMEOUT;
986 b0a6bcf7 2022-09-13 op goto err;
987 b0a6bcf7 2022-09-13 op }
988 b0a6bcf7 2022-09-13 op
989 b0a6bcf7 2022-09-13 op if (EVBUFFER_LENGTH(bufev->output)) {
990 b0a6bcf7 2022-09-13 op ret = tls_write(clt->clt_ctx,
991 b0a6bcf7 2022-09-13 op EVBUFFER_DATA(bufev->output),
992 b0a6bcf7 2022-09-13 op EVBUFFER_LENGTH(bufev->output));
993 b0a6bcf7 2022-09-13 op if (ret == TLS_WANT_POLLIN || ret == TLS_WANT_POLLOUT) {
994 b0a6bcf7 2022-09-13 op goto retry;
995 b0a6bcf7 2022-09-13 op } else if (ret == -1) {
996 b0a6bcf7 2022-09-13 op what |= EVBUFFER_ERROR;
997 b0a6bcf7 2022-09-13 op goto err;
998 b0a6bcf7 2022-09-13 op }
999 b0a6bcf7 2022-09-13 op len = ret;
1000 b0a6bcf7 2022-09-13 op evbuffer_drain(bufev->output, len);
1001 b0a6bcf7 2022-09-13 op }
1002 b0a6bcf7 2022-09-13 op
1003 b0a6bcf7 2022-09-13 op if (EVBUFFER_LENGTH(bufev->output) != 0)
1004 83f0f95a 2022-09-29 op proxy_bufferevent_add(&bufev->ev_write,
1005 83f0f95a 2022-09-29 op G_TOUT(bufev->timeout_write));
1006 b0a6bcf7 2022-09-13 op
1007 b0a6bcf7 2022-09-13 op if (bufev->writecb != NULL &&
1008 b0a6bcf7 2022-09-13 op EVBUFFER_LENGTH(bufev->output) <= bufev->wm_write.low)
1009 b0a6bcf7 2022-09-13 op (*bufev->writecb)(bufev, bufev->cbarg);
1010 b0a6bcf7 2022-09-13 op return;
1011 b0a6bcf7 2022-09-13 op
1012 b0a6bcf7 2022-09-13 op retry:
1013 83f0f95a 2022-09-29 op proxy_bufferevent_add(&bufev->ev_write, G_TOUT(bufev->timeout_write));
1014 b0a6bcf7 2022-09-13 op return;
1015 b0a6bcf7 2022-09-13 op
1016 b0a6bcf7 2022-09-13 op err:
1017 b0a6bcf7 2022-09-13 op (*bufev->errorcb)(bufev, what, bufev->cbarg);
1018 b0a6bcf7 2022-09-13 op }
1019 b0a6bcf7 2022-09-13 op
1020 b0a6bcf7 2022-09-13 op void
1021 b0a6bcf7 2022-09-13 op proxy_client_free(struct client *clt)
1022 b0a6bcf7 2022-09-13 op {
1023 b0a6bcf7 2022-09-13 op if (clt->clt_evasr)
1024 b0a6bcf7 2022-09-13 op event_asr_abort(clt->clt_evasr);
1025 b0a6bcf7 2022-09-13 op
1026 b0a6bcf7 2022-09-13 op if (clt->clt_addrinfo)
1027 b0a6bcf7 2022-09-13 op freeaddrinfo(clt->clt_addrinfo);
1028 b0a6bcf7 2022-09-13 op
1029 b0a6bcf7 2022-09-13 op if (clt->clt_evconn_live)
1030 b0a6bcf7 2022-09-13 op event_del(&clt->clt_evconn);
1031 b0a6bcf7 2022-09-13 op
1032 b0a6bcf7 2022-09-13 op if (clt->clt_fd != -1)
1033 b0a6bcf7 2022-09-13 op close(clt->clt_fd);
1034 b0a6bcf7 2022-09-13 op
1035 b0a6bcf7 2022-09-13 op if (clt->clt_ctx)
1036 b0a6bcf7 2022-09-13 op tls_free(clt->clt_ctx);
1037 b0a6bcf7 2022-09-13 op
1038 b0a6bcf7 2022-09-13 op if (clt->clt_bev)
1039 b0a6bcf7 2022-09-13 op bufferevent_free(clt->clt_bev);
1040 a244322c 2022-09-29 op
1041 a244322c 2022-09-29 op template_free(clt->clt_tp);
1042 b0a6bcf7 2022-09-13 op
1043 8857131d 2022-09-20 op free(clt->clt_body);
1044 b0a6bcf7 2022-09-13 op free(clt->clt_server_name);
1045 b0a6bcf7 2022-09-13 op free(clt->clt_script_name);
1046 b0a6bcf7 2022-09-13 op free(clt->clt_path_info);
1047 28239bac 2022-09-20 op free(clt->clt_query);
1048 b0a6bcf7 2022-09-13 op free(clt);
1049 b0a6bcf7 2022-09-13 op }