/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to breezy/tests/http_server.py

  • Committer: Jelmer Vernooij
  • Date: 2020-03-22 01:35:14 UTC
  • mfrom: (7490.7.6 work)
  • mto: This revision was merged to the branch mainline in revision 7499.
  • Revision ID: jelmer@jelmer.uk-20200322013514-7vw1ntwho04rcuj3
merge lp:brz/3.1.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2006-2011 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
16
 
 
17
import errno
 
18
import http.client as http_client
 
19
import http.server as http_server
 
20
import os
 
21
import posixpath
 
22
import random
 
23
import re
 
24
import socket
 
25
import sys
 
26
from urllib.parse import urlparse
 
27
 
 
28
from .. import (
 
29
    osutils,
 
30
    urlutils,
 
31
)
 
32
from . import test_server
 
33
 
 
34
 
 
35
class BadWebserverPath(ValueError):
 
36
    def __str__(self):
 
37
        return 'path %s is not in %s' % self.args
 
38
 
 
39
 
 
40
class TestingHTTPRequestHandler(http_server.SimpleHTTPRequestHandler):
 
41
    """Handles one request.
 
42
 
 
43
    A TestingHTTPRequestHandler is instantiated for every request received by
 
44
    the associated server. Note that 'request' here is inherited from the base
 
45
    TCPServer class, for the HTTP server it is really a connection which itself
 
46
    will handle one or several HTTP requests.
 
47
    """
 
48
    # Default protocol version
 
49
    protocol_version = 'HTTP/1.1'
 
50
 
 
51
    # The Message-like class used to parse the request headers
 
52
    MessageClass = http_client.HTTPMessage
 
53
 
 
54
    def setup(self):
 
55
        http_server.SimpleHTTPRequestHandler.setup(self)
 
56
        self._cwd = self.server._home_dir
 
57
        tcs = self.server.test_case_server
 
58
        if tcs.protocol_version is not None:
 
59
            # If the test server forced a protocol version, use it
 
60
            self.protocol_version = tcs.protocol_version
 
61
 
 
62
    def log_message(self, format, *args):
 
63
        tcs = self.server.test_case_server
 
64
        tcs.log('webserver - %s - - [%s] %s "%s" "%s"',
 
65
                self.address_string(),
 
66
                self.log_date_time_string(),
 
67
                format % args,
 
68
                self.headers.get('referer', '-'),
 
69
                self.headers.get('user-agent', '-'))
 
70
 
 
71
    def handle_one_request(self):
 
72
        """Handle a single HTTP request.
 
73
 
 
74
        We catch all socket errors occurring when the client close the
 
75
        connection early to avoid polluting the test results.
 
76
        """
 
77
        try:
 
78
            self._handle_one_request()
 
79
        except socket.error as e:
 
80
            # Any socket error should close the connection, but some errors are
 
81
            # due to the client closing early and we don't want to pollute test
 
82
            # results, so we raise only the others.
 
83
            self.close_connection = 1
 
84
            if (len(e.args) == 0
 
85
                or e.args[0] not in (errno.EPIPE, errno.ECONNRESET,
 
86
                                     errno.ECONNABORTED, errno.EBADF)):
 
87
                raise
 
88
 
 
89
    error_content_type = 'text/plain'
 
90
    error_message_format = '''\
 
91
Error code: %(code)s.
 
92
Message: %(message)s.
 
93
'''
 
94
 
 
95
    def send_error(self, code, message=None):
 
96
        """Send and log an error reply.
 
97
 
 
98
        We redefine the python-provided version to be able to set a
 
99
        ``Content-Length`` header as some http/1.1 clients complain otherwise
 
100
        (see bug #568421).
 
101
 
 
102
        :param code: The HTTP error code.
 
103
 
 
104
        :param message: The explanation of the error code, Defaults to a short
 
105
             entry.
 
106
        """
 
107
 
 
108
        if message is None:
 
109
            try:
 
110
                message = self.responses[code][0]
 
111
            except KeyError:
 
112
                message = '???'
 
113
        self.log_error("code %d, message %s", code, message)
 
114
        content = (self.error_message_format %
 
115
                   {'code': code, 'message': message})
 
116
        self.send_response(code, message)
 
117
        self.send_header("Content-Type", self.error_content_type)
 
118
        self.send_header("Content-Length", "%d" % len(content))
 
119
        self.send_header('Connection', 'close')
 
120
        self.end_headers()
 
121
        if self.command != 'HEAD' and code >= 200 and code not in (204, 304):
 
122
            self.wfile.write(content.encode('utf-8'))
 
123
 
 
124
    def _handle_one_request(self):
 
125
        http_server.SimpleHTTPRequestHandler.handle_one_request(self)
 
126
 
 
127
    _range_regexp = re.compile(r'^(?P<start>\d+)-(?P<end>\d+)?$')
 
128
    _tail_regexp = re.compile(r'^-(?P<tail>\d+)$')
 
129
 
 
130
    def _parse_ranges(self, ranges_header, file_size):
 
131
        """Parse the range header value and returns ranges.
 
132
 
 
133
        RFC2616 14.35 says that syntactically invalid range specifiers MUST be
 
134
        ignored. In that case, we return None instead of a range list.
 
135
 
 
136
        :param ranges_header: The 'Range' header value.
 
137
 
 
138
        :param file_size: The size of the requested file.
 
139
 
 
140
        :return: A list of (start, end) tuples or None if some invalid range
 
141
            specifier is encountered.
 
142
        """
 
143
        if not ranges_header.startswith('bytes='):
 
144
            # Syntactically invalid header
 
145
            return None
 
146
 
 
147
        tail = None
 
148
        ranges = []
 
149
        ranges_header = ranges_header[len('bytes='):]
 
150
        for range_str in ranges_header.split(','):
 
151
            range_match = self._range_regexp.match(range_str)
 
152
            if range_match is not None:
 
153
                start = int(range_match.group('start'))
 
154
                end_match = range_match.group('end')
 
155
                if end_match is None:
 
156
                    # RFC2616 says end is optional and default to file_size
 
157
                    end = file_size
 
158
                else:
 
159
                    end = int(end_match)
 
160
                if start > end:
 
161
                    # Syntactically invalid range
 
162
                    return None
 
163
                ranges.append((start, end))
 
164
            else:
 
165
                tail_match = self._tail_regexp.match(range_str)
 
166
                if tail_match is not None:
 
167
                    tail = int(tail_match.group('tail'))
 
168
                else:
 
169
                    # Syntactically invalid range
 
170
                    return None
 
171
        if tail is not None:
 
172
            # Normalize tail into ranges
 
173
            ranges.append((max(0, file_size - tail), file_size))
 
174
 
 
175
        checked_ranges = []
 
176
        for start, end in ranges:
 
177
            if start >= file_size:
 
178
                # RFC2616 14.35, ranges are invalid if start >= file_size
 
179
                return None
 
180
            # RFC2616 14.35, end values should be truncated
 
181
            # to file_size -1 if they exceed it
 
182
            end = min(end, file_size - 1)
 
183
            checked_ranges.append((start, end))
 
184
        return checked_ranges
 
185
 
 
186
    def _header_line_length(self, keyword, value):
 
187
        header_line = '%s: %s\r\n' % (keyword, value)
 
188
        return len(header_line)
 
189
 
 
190
    def send_head(self):
 
191
        """Overrides base implementation to work around a bug in python2.5."""
 
192
        path = self.translate_path(self.path)
 
193
        if os.path.isdir(path) and not self.path.endswith('/'):
 
194
            # redirect browser - doing basically what apache does when
 
195
            # DirectorySlash option is On which is quite common (braindead, but
 
196
            # common)
 
197
            self.send_response(301)
 
198
            self.send_header("Location", self.path + "/")
 
199
            # Indicates that the body is empty for HTTP/1.1 clients
 
200
            self.send_header('Content-Length', '0')
 
201
            self.end_headers()
 
202
            return None
 
203
 
 
204
        return http_server.SimpleHTTPRequestHandler.send_head(self)
 
205
 
 
206
    def send_range_content(self, file, start, length):
 
207
        file.seek(start)
 
208
        self.wfile.write(file.read(length))
 
209
 
 
210
    def get_single_range(self, file, file_size, start, end):
 
211
        self.send_response(206)
 
212
        length = end - start + 1
 
213
        self.send_header('Accept-Ranges', 'bytes')
 
214
        self.send_header("Content-Length", "%d" % length)
 
215
 
 
216
        self.send_header("Content-Type", 'application/octet-stream')
 
217
        self.send_header("Content-Range", "bytes %d-%d/%d" % (start,
 
218
                                                              end,
 
219
                                                              file_size))
 
220
        self.end_headers()
 
221
        self.send_range_content(file, start, length)
 
222
 
 
223
    def get_multiple_ranges(self, file, file_size, ranges):
 
224
        self.send_response(206)
 
225
        self.send_header('Accept-Ranges', 'bytes')
 
226
        boundary = '%d' % random.randint(0, 0x7FFFFFFF)
 
227
        self.send_header('Content-Type',
 
228
                         'multipart/byteranges; boundary=%s' % boundary)
 
229
        boundary_line = b'--%s\r\n' % boundary.encode('ascii')
 
230
        # Calculate the Content-Length
 
231
        content_length = 0
 
232
        for (start, end) in ranges:
 
233
            content_length += len(boundary_line)
 
234
            content_length += self._header_line_length(
 
235
                'Content-type', 'application/octet-stream')
 
236
            content_length += self._header_line_length(
 
237
                'Content-Range', 'bytes %d-%d/%d' % (start, end, file_size))
 
238
            content_length += len('\r\n')  # end headers
 
239
            content_length += end - start + 1
 
240
        content_length += len(boundary_line)
 
241
        self.send_header('Content-length', content_length)
 
242
        self.end_headers()
 
243
 
 
244
        # Send the multipart body
 
245
        for (start, end) in ranges:
 
246
            self.wfile.write(boundary_line)
 
247
            self.send_header('Content-type', 'application/octet-stream')
 
248
            self.send_header('Content-Range', 'bytes %d-%d/%d'
 
249
                             % (start, end, file_size))
 
250
            self.end_headers()
 
251
            self.send_range_content(file, start, end - start + 1)
 
252
        # Final boundary
 
253
        self.wfile.write(boundary_line)
 
254
 
 
255
    def do_GET(self):
 
256
        """Serve a GET request.
 
257
 
 
258
        Handles the Range header.
 
259
        """
 
260
        # Update statistics
 
261
        self.server.test_case_server.GET_request_nb += 1
 
262
 
 
263
        path = self.translate_path(self.path)
 
264
        ranges_header_value = self.headers.get('Range')
 
265
        if ranges_header_value is None or os.path.isdir(path):
 
266
            # Let the mother class handle most cases
 
267
            return http_server.SimpleHTTPRequestHandler.do_GET(self)
 
268
 
 
269
        try:
 
270
            # Always read in binary mode. Opening files in text
 
271
            # mode may cause newline translations, making the
 
272
            # actual size of the content transmitted *less* than
 
273
            # the content-length!
 
274
            f = open(path, 'rb')
 
275
        except IOError:
 
276
            self.send_error(404, "File not found")
 
277
            return
 
278
 
 
279
        file_size = os.fstat(f.fileno())[6]
 
280
        ranges = self._parse_ranges(ranges_header_value, file_size)
 
281
        if not ranges:
 
282
            # RFC2616 14.16 and 14.35 says that when a server
 
283
            # encounters unsatisfiable range specifiers, it
 
284
            # SHOULD return a 416.
 
285
            f.close()
 
286
            # FIXME: We SHOULD send a Content-Range header too,
 
287
            # but the implementation of send_error does not
 
288
            # allows that. So far.
 
289
            self.send_error(416, "Requested range not satisfiable")
 
290
            return
 
291
 
 
292
        if len(ranges) == 1:
 
293
            (start, end) = ranges[0]
 
294
            self.get_single_range(f, file_size, start, end)
 
295
        else:
 
296
            self.get_multiple_ranges(f, file_size, ranges)
 
297
        f.close()
 
298
 
 
299
    def translate_path(self, path):
 
300
        """Translate a /-separated PATH to the local filename syntax.
 
301
 
 
302
        If the server requires it, proxy the path before the usual translation
 
303
        """
 
304
        if self.server.test_case_server.proxy_requests:
 
305
            # We need to act as a proxy and accept absolute urls,
 
306
            # which SimpleHTTPRequestHandler (parent) is not
 
307
            # ready for. So we just drop the protocol://host:port
 
308
            # part in front of the request-url (because we know
 
309
            # we would not forward the request to *another*
 
310
            # proxy).
 
311
 
 
312
            # So we do what SimpleHTTPRequestHandler.translate_path
 
313
            # do beginning with python 2.4.3: abandon query
 
314
            # parameters, scheme, host port, etc (which ensure we
 
315
            # provide the right behaviour on all python versions).
 
316
            path = urlparse(path)[2]
 
317
            # And now, we can apply *our* trick to proxy files
 
318
            path += '-proxied'
 
319
 
 
320
        return self._translate_path(path)
 
321
 
 
322
    def _translate_path(self, path):
 
323
        """Translate a /-separated PATH to the local filename syntax.
 
324
 
 
325
        Note that we're translating http URLs here, not file URLs.
 
326
        The URL root location is the server's startup directory.
 
327
        Components that mean special things to the local file system
 
328
        (e.g. drive or directory names) are ignored.  (XXX They should
 
329
        probably be diagnosed.)
 
330
 
 
331
        Override from python standard library to stop it calling os.getcwd()
 
332
        """
 
333
        # abandon query parameters
 
334
        path = urlparse(path)[2]
 
335
        path = posixpath.normpath(urlutils.unquote(path))
 
336
        words = path.split('/')
 
337
        path = self._cwd
 
338
        for num, word in enumerate(w for w in words if w):
 
339
            if num == 0:
 
340
                drive, word = os.path.splitdrive(word)
 
341
            head, word = os.path.split(word)
 
342
            if word in (os.curdir, os.pardir):
 
343
                continue
 
344
            path = os.path.join(path, word)
 
345
        return path
 
346
 
 
347
 
 
348
class TestingHTTPServerMixin:
 
349
 
 
350
    def __init__(self, test_case_server):
 
351
        # test_case_server can be used to communicate between the
 
352
        # tests and the server (or the request handler and the
 
353
        # server), allowing dynamic behaviors to be defined from
 
354
        # the tests cases.
 
355
        self.test_case_server = test_case_server
 
356
        self._home_dir = test_case_server._home_dir
 
357
 
 
358
 
 
359
class TestingHTTPServer(test_server.TestingTCPServer, TestingHTTPServerMixin):
 
360
 
 
361
    def __init__(self, server_address, request_handler_class,
 
362
                 test_case_server):
 
363
        test_server.TestingTCPServer.__init__(self, server_address,
 
364
                                              request_handler_class)
 
365
        TestingHTTPServerMixin.__init__(self, test_case_server)
 
366
 
 
367
 
 
368
class TestingThreadingHTTPServer(test_server.TestingThreadingTCPServer,
 
369
                                 TestingHTTPServerMixin):
 
370
    """A threading HTTP test server for HTTP 1.1.
 
371
 
 
372
    Since tests can initiate several concurrent connections to the same http
 
373
    server, we need an independent connection for each of them. We achieve that
 
374
    by spawning a new thread for each connection.
 
375
    """
 
376
 
 
377
    def __init__(self, server_address, request_handler_class,
 
378
                 test_case_server):
 
379
        test_server.TestingThreadingTCPServer.__init__(self, server_address,
 
380
                                                       request_handler_class)
 
381
        TestingHTTPServerMixin.__init__(self, test_case_server)
 
382
 
 
383
 
 
384
class HttpServer(test_server.TestingTCPServerInAThread):
 
385
    """A test server for http transports.
 
386
 
 
387
    Subclasses can provide a specific request handler.
 
388
    """
 
389
 
 
390
    # The real servers depending on the protocol
 
391
    http_server_class = {'HTTP/1.0': TestingHTTPServer,
 
392
                         'HTTP/1.1': TestingThreadingHTTPServer,
 
393
                         }
 
394
 
 
395
    # Whether or not we proxy the requests (see
 
396
    # TestingHTTPRequestHandler.translate_path).
 
397
    proxy_requests = False
 
398
 
 
399
    # used to form the url that connects to this server
 
400
    _url_protocol = 'http'
 
401
 
 
402
    def __init__(self, request_handler=TestingHTTPRequestHandler,
 
403
                 protocol_version=None):
 
404
        """Constructor.
 
405
 
 
406
        :param request_handler: a class that will be instantiated to handle an
 
407
            http connection (one or several requests).
 
408
 
 
409
        :param protocol_version: if specified, will override the protocol
 
410
            version of the request handler.
 
411
        """
 
412
        # Depending on the protocol version, we will create the approriate
 
413
        # server
 
414
        if protocol_version is None:
 
415
            # Use the request handler one
 
416
            proto_vers = request_handler.protocol_version
 
417
        else:
 
418
            # Use our own, it will be used to override the request handler
 
419
            # one too.
 
420
            proto_vers = protocol_version
 
421
        # Get the appropriate server class for the required protocol
 
422
        serv_cls = self.http_server_class.get(proto_vers, None)
 
423
        if serv_cls is None:
 
424
            raise http_client.UnknownProtocol(proto_vers)
 
425
        self.host = 'localhost'
 
426
        self.port = 0
 
427
        super(HttpServer, self).__init__((self.host, self.port),
 
428
                                         serv_cls,
 
429
                                         request_handler)
 
430
        self.protocol_version = proto_vers
 
431
        # Allows tests to verify number of GET requests issued
 
432
        self.GET_request_nb = 0
 
433
        self._http_base_url = None
 
434
        self.logs = []
 
435
 
 
436
    def create_server(self):
 
437
        return self.server_class(
 
438
            (self.host, self.port), self.request_handler_class, self)
 
439
 
 
440
    def _get_remote_url(self, path):
 
441
        path_parts = path.split(os.path.sep)
 
442
        if os.path.isabs(path):
 
443
            if path_parts[:len(self._local_path_parts)] != \
 
444
                    self._local_path_parts:
 
445
                raise BadWebserverPath(path, self.test_dir)
 
446
            remote_path = '/'.join(path_parts[len(self._local_path_parts):])
 
447
        else:
 
448
            remote_path = '/'.join(path_parts)
 
449
 
 
450
        return self._http_base_url + remote_path
 
451
 
 
452
    def log(self, format, *args):
 
453
        """Capture Server log output."""
 
454
        self.logs.append(format % args)
 
455
 
 
456
    def start_server(self, backing_transport_server=None):
 
457
        """See breezy.transport.Server.start_server.
 
458
 
 
459
        :param backing_transport_server: The transport that requests over this
 
460
            protocol should be forwarded to. Note that this is currently not
 
461
            supported for HTTP.
 
462
        """
 
463
        # XXX: TODO: make the server back onto vfs_server rather than local
 
464
        # disk.
 
465
        if not (backing_transport_server is None
 
466
                or isinstance(backing_transport_server,
 
467
                              test_server.LocalURLServer)):
 
468
            raise AssertionError(
 
469
                "HTTPServer currently assumes local transport, got %s" %
 
470
                backing_transport_server)
 
471
        self._home_dir = osutils.getcwd()
 
472
        self._local_path_parts = self._home_dir.split(os.path.sep)
 
473
        self.logs = []
 
474
 
 
475
        super(HttpServer, self).start_server()
 
476
        self._http_base_url = '%s://%s:%s/' % (
 
477
            self._url_protocol, self.host, self.port)
 
478
 
 
479
    def get_url(self):
 
480
        """See breezy.transport.Server.get_url."""
 
481
        return self._get_remote_url(self._home_dir)
 
482
 
 
483
    def get_bogus_url(self):
 
484
        """See breezy.transport.Server.get_bogus_url."""
 
485
        # this is chosen to try to prevent trouble with proxies, weird dns,
 
486
        # etc
 
487
        return self._url_protocol + '://127.0.0.1:1/'