/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/transport/sftp.py

  • Committer: Alexander Belchenko
  • Date: 2006-09-05 11:52:44 UTC
  • mto: (1711.9.16 jam-integration)
  • mto: This revision was merged to the branch mainline in revision 1984.
  • Revision ID: bialix@ukr.net-20060905115244-f567bf28c5d8d226
tree_implementations tests: build_tree with binary (LF) line-endings

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Robey Pointer <robey@lag.net>
 
2
# Copyright (C) 2005, 2006 Canonical Ltd
 
3
#
 
4
# This program is free software; you can redistribute it and/or modify
 
5
# it under the terms of the GNU General Public License as published by
 
6
# the Free Software Foundation; either version 2 of the License, or
 
7
# (at your option) any later version.
 
8
#
 
9
# This program is distributed in the hope that it will be useful,
 
10
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
11
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
12
# GNU General Public License for more details.
 
13
#
 
14
# You should have received a copy of the GNU General Public License
 
15
# along with this program; if not, write to the Free Software
 
16
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
17
 
 
18
"""Implementation of Transport over SFTP, using paramiko."""
 
19
 
 
20
import errno
 
21
import os
 
22
import random
 
23
import select
 
24
import socket
 
25
import stat
 
26
import subprocess
 
27
import sys
 
28
import time
 
29
import urllib
 
30
import urlparse
 
31
import weakref
 
32
 
 
33
from bzrlib.errors import (FileExists, 
 
34
                           NoSuchFile, PathNotChild,
 
35
                           TransportError,
 
36
                           LockError, 
 
37
                           PathError,
 
38
                           ParamikoNotPresent,
 
39
                           UnknownSSH,
 
40
                           )
 
41
from bzrlib.osutils import pathjoin, fancy_rename, getcwd
 
42
from bzrlib.trace import mutter, warning
 
43
from bzrlib.transport import (
 
44
    register_urlparse_netloc_protocol,
 
45
    Server,
 
46
    split_url,
 
47
    ssh,
 
48
    Transport,
 
49
    )
 
50
import bzrlib.urlutils as urlutils
 
51
 
 
52
try:
 
53
    import paramiko
 
54
except ImportError, e:
 
55
    raise ParamikoNotPresent(e)
 
56
else:
 
57
    from paramiko.sftp import (SFTP_FLAG_WRITE, SFTP_FLAG_CREATE,
 
58
                               SFTP_FLAG_EXCL, SFTP_FLAG_TRUNC,
 
59
                               CMD_HANDLE, CMD_OPEN)
 
60
    from paramiko.sftp_attr import SFTPAttributes
 
61
    from paramiko.sftp_file import SFTPFile
 
62
 
 
63
 
 
64
register_urlparse_netloc_protocol('sftp')
 
65
 
 
66
 
 
67
# This is a weakref dictionary, so that we can reuse connections
 
68
# that are still active. Long term, it might be nice to have some
 
69
# sort of expiration policy, such as disconnect if inactive for
 
70
# X seconds. But that requires a lot more fanciness.
 
71
_connected_hosts = weakref.WeakValueDictionary()
 
72
 
 
73
 
 
74
_paramiko_version = getattr(paramiko, '__version_info__', (0, 0, 0))
 
75
# don't use prefetch unless paramiko version >= 1.5.5 (there were bugs earlier)
 
76
_default_do_prefetch = (_paramiko_version >= (1, 5, 5))
 
77
 
 
78
 
 
79
def clear_connection_cache():
 
80
    """Remove all hosts from the SFTP connection cache.
 
81
 
 
82
    Primarily useful for test cases wanting to force garbage collection.
 
83
    """
 
84
    _connected_hosts.clear()
 
85
 
 
86
 
 
87
class SFTPLock(object):
 
88
    """This fakes a lock in a remote location."""
 
89
    __slots__ = ['path', 'lock_path', 'lock_file', 'transport']
 
90
    def __init__(self, path, transport):
 
91
        assert isinstance(transport, SFTPTransport)
 
92
 
 
93
        self.lock_file = None
 
94
        self.path = path
 
95
        self.lock_path = path + '.write-lock'
 
96
        self.transport = transport
 
97
        try:
 
98
            # RBC 20060103 FIXME should we be using private methods here ?
 
99
            abspath = transport._remote_path(self.lock_path)
 
100
            self.lock_file = transport._sftp_open_exclusive(abspath)
 
101
        except FileExists:
 
102
            raise LockError('File %r already locked' % (self.path,))
 
103
 
 
104
    def __del__(self):
 
105
        """Should this warn, or actually try to cleanup?"""
 
106
        if self.lock_file:
 
107
            warning("SFTPLock %r not explicitly unlocked" % (self.path,))
 
108
            self.unlock()
 
109
 
 
110
    def unlock(self):
 
111
        if not self.lock_file:
 
112
            return
 
113
        self.lock_file.close()
 
114
        self.lock_file = None
 
115
        try:
 
116
            self.transport.delete(self.lock_path)
 
117
        except (NoSuchFile,):
 
118
            # What specific errors should we catch here?
 
119
            pass
 
120
 
 
121
 
 
122
class SFTPTransport(Transport):
 
123
    """Transport implementation for SFTP access."""
 
124
 
 
125
    _do_prefetch = _default_do_prefetch
 
126
    # TODO: jam 20060717 Conceivably these could be configurable, either
 
127
    #       by auto-tuning at run-time, or by a configuration (per host??)
 
128
    #       but the performance curve is pretty flat, so just going with
 
129
    #       reasonable defaults.
 
130
    _max_readv_combine = 200
 
131
    # Having to round trip to the server means waiting for a response,
 
132
    # so it is better to download extra bytes.
 
133
    # 8KiB had good performance for both local and remote network operations
 
134
    _bytes_to_read_before_seek = 8192
 
135
 
 
136
    # The sftp spec says that implementations SHOULD allow reads
 
137
    # to be at least 32K. paramiko.readv() does an async request
 
138
    # for the chunks. So we need to keep it within a single request
 
139
    # size for paramiko <= 1.6.1. paramiko 1.6.2 will probably chop
 
140
    # up the request itself, rather than us having to worry about it
 
141
    _max_request_size = 32768
 
142
 
 
143
    def __init__(self, base, clone_from=None):
 
144
        assert base.startswith('sftp://')
 
145
        self._parse_url(base)
 
146
        base = self._unparse_url()
 
147
        if base[-1] != '/':
 
148
            base += '/'
 
149
        super(SFTPTransport, self).__init__(base)
 
150
        if clone_from is None:
 
151
            self._sftp_connect()
 
152
        else:
 
153
            # use the same ssh connection, etc
 
154
            self._sftp = clone_from._sftp
 
155
        # super saves 'self.base'
 
156
    
 
157
    def should_cache(self):
 
158
        """
 
159
        Return True if the data pulled across should be cached locally.
 
160
        """
 
161
        return True
 
162
 
 
163
    def clone(self, offset=None):
 
164
        """
 
165
        Return a new SFTPTransport with root at self.base + offset.
 
166
        We share the same SFTP session between such transports, because it's
 
167
        fairly expensive to set them up.
 
168
        """
 
169
        if offset is None:
 
170
            return SFTPTransport(self.base, self)
 
171
        else:
 
172
            return SFTPTransport(self.abspath(offset), self)
 
173
 
 
174
    def abspath(self, relpath):
 
175
        """
 
176
        Return the full url to the given relative path.
 
177
        
 
178
        @param relpath: the relative path or path components
 
179
        @type relpath: str or list
 
180
        """
 
181
        return self._unparse_url(self._remote_path(relpath))
 
182
    
 
183
    def _remote_path(self, relpath):
 
184
        """Return the path to be passed along the sftp protocol for relpath.
 
185
        
 
186
        relpath is a urlencoded string.
 
187
        """
 
188
        # FIXME: share the common code across transports
 
189
        assert isinstance(relpath, basestring)
 
190
        relpath = urlutils.unescape(relpath).split('/')
 
191
        basepath = self._path.split('/')
 
192
        if len(basepath) > 0 and basepath[-1] == '':
 
193
            basepath = basepath[:-1]
 
194
 
 
195
        for p in relpath:
 
196
            if p == '..':
 
197
                if len(basepath) == 0:
 
198
                    # In most filesystems, a request for the parent
 
199
                    # of root, just returns root.
 
200
                    continue
 
201
                basepath.pop()
 
202
            elif p == '.':
 
203
                continue # No-op
 
204
            else:
 
205
                basepath.append(p)
 
206
 
 
207
        path = '/'.join(basepath)
 
208
        # mutter('relpath => remotepath %s => %s', relpath, path)
 
209
        return path
 
210
 
 
211
    def relpath(self, abspath):
 
212
        username, password, host, port, path = self._split_url(abspath)
 
213
        error = []
 
214
        if (username != self._username):
 
215
            error.append('username mismatch')
 
216
        if (host != self._host):
 
217
            error.append('host mismatch')
 
218
        if (port != self._port):
 
219
            error.append('port mismatch')
 
220
        if (not path.startswith(self._path)):
 
221
            error.append('path mismatch')
 
222
        if error:
 
223
            extra = ': ' + ', '.join(error)
 
224
            raise PathNotChild(abspath, self.base, extra=extra)
 
225
        pl = len(self._path)
 
226
        return path[pl:].strip('/')
 
227
 
 
228
    def has(self, relpath):
 
229
        """
 
230
        Does the target location exist?
 
231
        """
 
232
        try:
 
233
            self._sftp.stat(self._remote_path(relpath))
 
234
            return True
 
235
        except IOError:
 
236
            return False
 
237
 
 
238
    def get(self, relpath):
 
239
        """
 
240
        Get the file at the given relative path.
 
241
 
 
242
        :param relpath: The relative path to the file
 
243
        """
 
244
        try:
 
245
            path = self._remote_path(relpath)
 
246
            f = self._sftp.file(path, mode='rb')
 
247
            if self._do_prefetch and (getattr(f, 'prefetch', None) is not None):
 
248
                f.prefetch()
 
249
            return f
 
250
        except (IOError, paramiko.SSHException), e:
 
251
            self._translate_io_exception(e, path, ': error retrieving')
 
252
 
 
253
    def readv(self, relpath, offsets):
 
254
        """See Transport.readv()"""
 
255
        # We overload the default readv() because we want to use a file
 
256
        # that does not have prefetch enabled.
 
257
        # Also, if we have a new paramiko, it implements an async readv()
 
258
        if not offsets:
 
259
            return
 
260
 
 
261
        try:
 
262
            path = self._remote_path(relpath)
 
263
            fp = self._sftp.file(path, mode='rb')
 
264
            readv = getattr(fp, 'readv', None)
 
265
            if readv:
 
266
                return self._sftp_readv(fp, offsets)
 
267
            mutter('seek and read %s offsets', len(offsets))
 
268
            return self._seek_and_read(fp, offsets)
 
269
        except (IOError, paramiko.SSHException), e:
 
270
            self._translate_io_exception(e, path, ': error retrieving')
 
271
 
 
272
    def _sftp_readv(self, fp, offsets):
 
273
        """Use the readv() member of fp to do async readv.
 
274
 
 
275
        And then read them using paramiko.readv(). paramiko.readv()
 
276
        does not support ranges > 64K, so it caps the request size, and
 
277
        just reads until it gets all the stuff it wants
 
278
        """
 
279
        offsets = list(offsets)
 
280
        sorted_offsets = sorted(offsets)
 
281
 
 
282
        # The algorithm works as follows:
 
283
        # 1) Coalesce nearby reads into a single chunk
 
284
        #    This generates a list of combined regions, the total size
 
285
        #    and the size of the sub regions. This coalescing step is limited
 
286
        #    in the number of nearby chunks to combine, and is allowed to
 
287
        #    skip small breaks in the requests. Limiting it makes sure that
 
288
        #    we can start yielding some data earlier, and skipping means we
 
289
        #    make fewer requests. (Beneficial even when using async)
 
290
        # 2) Break up this combined regions into chunks that are smaller
 
291
        #    than 64KiB. Technically the limit is 65536, but we are a
 
292
        #    little bit conservative. This is because sftp has a maximum
 
293
        #    return chunk size of 64KiB (max size of an unsigned short)
 
294
        # 3) Issue a readv() to paramiko to create an async request for
 
295
        #    all of this data
 
296
        # 4) Read in the data as it comes back, until we've read one
 
297
        #    continuous section as determined in step 1
 
298
        # 5) Break up the full sections into hunks for the original requested
 
299
        #    offsets. And put them in a cache
 
300
        # 6) Check if the next request is in the cache, and if it is, remove
 
301
        #    it from the cache, and yield its data. Continue until no more
 
302
        #    entries are in the cache.
 
303
        # 7) loop back to step 4 until all data has been read
 
304
        #
 
305
        # TODO: jam 20060725 This could be optimized one step further, by
 
306
        #       attempting to yield whatever data we have read, even before
 
307
        #       the first coallesced section has been fully processed.
 
308
 
 
309
        # When coalescing for use with readv(), we don't really need to
 
310
        # use any fudge factor, because the requests are made asynchronously
 
311
        coalesced = list(self._coalesce_offsets(sorted_offsets,
 
312
                               limit=self._max_readv_combine,
 
313
                               fudge_factor=0,
 
314
                               ))
 
315
        requests = []
 
316
        for c_offset in coalesced:
 
317
            start = c_offset.start
 
318
            size = c_offset.length
 
319
 
 
320
            # We need to break this up into multiple requests
 
321
            while size > 0:
 
322
                next_size = min(size, self._max_request_size)
 
323
                requests.append((start, next_size))
 
324
                size -= next_size
 
325
                start += next_size
 
326
 
 
327
        mutter('SFTP.readv() %s offsets => %s coalesced => %s requests',
 
328
                len(offsets), len(coalesced), len(requests))
 
329
 
 
330
        # Queue the current read until we have read the full coalesced section
 
331
        cur_data = []
 
332
        cur_data_len = 0
 
333
        cur_coalesced_stack = iter(coalesced)
 
334
        cur_coalesced = cur_coalesced_stack.next()
 
335
 
 
336
        # Cache the results, but only until they have been fulfilled
 
337
        data_map = {}
 
338
        # turn the list of offsets into a stack
 
339
        offset_stack = iter(offsets)
 
340
        cur_offset_and_size = offset_stack.next()
 
341
 
 
342
        for data in fp.readv(requests):
 
343
            cur_data += data
 
344
            cur_data_len += len(data)
 
345
 
 
346
            if cur_data_len < cur_coalesced.length:
 
347
                continue
 
348
            assert cur_data_len == cur_coalesced.length, \
 
349
                "Somehow we read too much: %s != %s" % (cur_data_len,
 
350
                                                        cur_coalesced.length)
 
351
            all_data = ''.join(cur_data)
 
352
            cur_data = []
 
353
            cur_data_len = 0
 
354
 
 
355
            for suboffset, subsize in cur_coalesced.ranges:
 
356
                key = (cur_coalesced.start+suboffset, subsize)
 
357
                data_map[key] = all_data[suboffset:suboffset+subsize]
 
358
 
 
359
            # Now that we've read some data, see if we can yield anything back
 
360
            while cur_offset_and_size in data_map:
 
361
                this_data = data_map.pop(cur_offset_and_size)
 
362
                yield cur_offset_and_size[0], this_data
 
363
                cur_offset_and_size = offset_stack.next()
 
364
 
 
365
            # Now that we've read all of the data for this coalesced section
 
366
            # on to the next
 
367
            cur_coalesced = cur_coalesced_stack.next()
 
368
 
 
369
    def put(self, relpath, f, mode=None):
 
370
        """
 
371
        Copy the file-like or string object into the location.
 
372
 
 
373
        :param relpath: Location to put the contents, relative to base.
 
374
        :param f:       File-like or string object.
 
375
        :param mode: The final mode for the file
 
376
        """
 
377
        final_path = self._remote_path(relpath)
 
378
        self._put(final_path, f, mode=mode)
 
379
 
 
380
    def _put(self, abspath, f, mode=None):
 
381
        """Helper function so both put() and copy_abspaths can reuse the code"""
 
382
        tmp_abspath = '%s.tmp.%.9f.%d.%d' % (abspath, time.time(),
 
383
                        os.getpid(), random.randint(0,0x7FFFFFFF))
 
384
        fout = self._sftp_open_exclusive(tmp_abspath, mode=mode)
 
385
        closed = False
 
386
        try:
 
387
            try:
 
388
                fout.set_pipelined(True)
 
389
                self._pump(f, fout)
 
390
            except (IOError, paramiko.SSHException), e:
 
391
                self._translate_io_exception(e, tmp_abspath)
 
392
            if mode is not None:
 
393
                self._sftp.chmod(tmp_abspath, mode)
 
394
            fout.close()
 
395
            closed = True
 
396
            self._rename_and_overwrite(tmp_abspath, abspath)
 
397
        except Exception, e:
 
398
            # If we fail, try to clean up the temporary file
 
399
            # before we throw the exception
 
400
            # but don't let another exception mess things up
 
401
            # Write out the traceback, because otherwise
 
402
            # the catch and throw destroys it
 
403
            import traceback
 
404
            mutter(traceback.format_exc())
 
405
            try:
 
406
                if not closed:
 
407
                    fout.close()
 
408
                self._sftp.remove(tmp_abspath)
 
409
            except:
 
410
                # raise the saved except
 
411
                raise e
 
412
            # raise the original with its traceback if we can.
 
413
            raise
 
414
 
 
415
    def iter_files_recursive(self):
 
416
        """Walk the relative paths of all files in this transport."""
 
417
        queue = list(self.list_dir('.'))
 
418
        while queue:
 
419
            relpath = queue.pop(0)
 
420
            st = self.stat(relpath)
 
421
            if stat.S_ISDIR(st.st_mode):
 
422
                for i, basename in enumerate(self.list_dir(relpath)):
 
423
                    queue.insert(i, relpath+'/'+basename)
 
424
            else:
 
425
                yield relpath
 
426
 
 
427
    def mkdir(self, relpath, mode=None):
 
428
        """Create a directory at the given path."""
 
429
        path = self._remote_path(relpath)
 
430
        try:
 
431
            # In the paramiko documentation, it says that passing a mode flag 
 
432
            # will filtered against the server umask.
 
433
            # StubSFTPServer does not do this, which would be nice, because it is
 
434
            # what we really want :)
 
435
            # However, real servers do use umask, so we really should do it that way
 
436
            self._sftp.mkdir(path)
 
437
            if mode is not None:
 
438
                self._sftp.chmod(path, mode=mode)
 
439
        except (paramiko.SSHException, IOError), e:
 
440
            self._translate_io_exception(e, path, ': unable to mkdir',
 
441
                failure_exc=FileExists)
 
442
 
 
443
    def _translate_io_exception(self, e, path, more_info='', 
 
444
                                failure_exc=PathError):
 
445
        """Translate a paramiko or IOError into a friendlier exception.
 
446
 
 
447
        :param e: The original exception
 
448
        :param path: The path in question when the error is raised
 
449
        :param more_info: Extra information that can be included,
 
450
                          such as what was going on
 
451
        :param failure_exc: Paramiko has the super fun ability to raise completely
 
452
                           opaque errors that just set "e.args = ('Failure',)" with
 
453
                           no more information.
 
454
                           If this parameter is set, it defines the exception 
 
455
                           to raise in these cases.
 
456
        """
 
457
        # paramiko seems to generate detailless errors.
 
458
        self._translate_error(e, path, raise_generic=False)
 
459
        if hasattr(e, 'args'):
 
460
            if (e.args == ('No such file or directory',) or
 
461
                e.args == ('No such file',)):
 
462
                raise NoSuchFile(path, str(e) + more_info)
 
463
            if (e.args == ('mkdir failed',)):
 
464
                raise FileExists(path, str(e) + more_info)
 
465
            # strange but true, for the paramiko server.
 
466
            if (e.args == ('Failure',)):
 
467
                raise failure_exc(path, str(e) + more_info)
 
468
            mutter('Raising exception with args %s', e.args)
 
469
        if hasattr(e, 'errno'):
 
470
            mutter('Raising exception with errno %s', e.errno)
 
471
        raise e
 
472
 
 
473
    def append(self, relpath, f, mode=None):
 
474
        """
 
475
        Append the text in the file-like object into the final
 
476
        location.
 
477
        """
 
478
        try:
 
479
            path = self._remote_path(relpath)
 
480
            fout = self._sftp.file(path, 'ab')
 
481
            if mode is not None:
 
482
                self._sftp.chmod(path, mode)
 
483
            result = fout.tell()
 
484
            self._pump(f, fout)
 
485
            return result
 
486
        except (IOError, paramiko.SSHException), e:
 
487
            self._translate_io_exception(e, relpath, ': unable to append')
 
488
 
 
489
    def rename(self, rel_from, rel_to):
 
490
        """Rename without special overwriting"""
 
491
        try:
 
492
            self._sftp.rename(self._remote_path(rel_from),
 
493
                              self._remote_path(rel_to))
 
494
        except (IOError, paramiko.SSHException), e:
 
495
            self._translate_io_exception(e, rel_from,
 
496
                    ': unable to rename to %r' % (rel_to))
 
497
 
 
498
    def _rename_and_overwrite(self, abs_from, abs_to):
 
499
        """Do a fancy rename on the remote server.
 
500
        
 
501
        Using the implementation provided by osutils.
 
502
        """
 
503
        try:
 
504
            fancy_rename(abs_from, abs_to,
 
505
                    rename_func=self._sftp.rename,
 
506
                    unlink_func=self._sftp.remove)
 
507
        except (IOError, paramiko.SSHException), e:
 
508
            self._translate_io_exception(e, abs_from, ': unable to rename to %r' % (abs_to))
 
509
 
 
510
    def move(self, rel_from, rel_to):
 
511
        """Move the item at rel_from to the location at rel_to"""
 
512
        path_from = self._remote_path(rel_from)
 
513
        path_to = self._remote_path(rel_to)
 
514
        self._rename_and_overwrite(path_from, path_to)
 
515
 
 
516
    def delete(self, relpath):
 
517
        """Delete the item at relpath"""
 
518
        path = self._remote_path(relpath)
 
519
        try:
 
520
            self._sftp.remove(path)
 
521
        except (IOError, paramiko.SSHException), e:
 
522
            self._translate_io_exception(e, path, ': unable to delete')
 
523
            
 
524
    def listable(self):
 
525
        """Return True if this store supports listing."""
 
526
        return True
 
527
 
 
528
    def list_dir(self, relpath):
 
529
        """
 
530
        Return a list of all files at the given location.
 
531
        """
 
532
        # does anything actually use this?
 
533
        # -- Unknown
 
534
        # This is at least used by copy_tree for remote upgrades.
 
535
        # -- David Allouche 2006-08-11
 
536
        path = self._remote_path(relpath)
 
537
        try:
 
538
            entries = self._sftp.listdir(path)
 
539
        except (IOError, paramiko.SSHException), e:
 
540
            self._translate_io_exception(e, path, ': failed to list_dir')
 
541
        return [urlutils.escape(entry) for entry in entries]
 
542
 
 
543
    def rmdir(self, relpath):
 
544
        """See Transport.rmdir."""
 
545
        path = self._remote_path(relpath)
 
546
        try:
 
547
            return self._sftp.rmdir(path)
 
548
        except (IOError, paramiko.SSHException), e:
 
549
            self._translate_io_exception(e, path, ': failed to rmdir')
 
550
 
 
551
    def stat(self, relpath):
 
552
        """Return the stat information for a file."""
 
553
        path = self._remote_path(relpath)
 
554
        try:
 
555
            return self._sftp.stat(path)
 
556
        except (IOError, paramiko.SSHException), e:
 
557
            self._translate_io_exception(e, path, ': unable to stat')
 
558
 
 
559
    def lock_read(self, relpath):
 
560
        """
 
561
        Lock the given file for shared (read) access.
 
562
        :return: A lock object, which has an unlock() member function
 
563
        """
 
564
        # FIXME: there should be something clever i can do here...
 
565
        class BogusLock(object):
 
566
            def __init__(self, path):
 
567
                self.path = path
 
568
            def unlock(self):
 
569
                pass
 
570
        return BogusLock(relpath)
 
571
 
 
572
    def lock_write(self, relpath):
 
573
        """
 
574
        Lock the given file for exclusive (write) access.
 
575
        WARNING: many transports do not support this, so trying avoid using it
 
576
 
 
577
        :return: A lock object, which has an unlock() member function
 
578
        """
 
579
        # This is a little bit bogus, but basically, we create a file
 
580
        # which should not already exist, and if it does, we assume
 
581
        # that there is a lock, and if it doesn't, the we assume
 
582
        # that we have taken the lock.
 
583
        return SFTPLock(relpath, self)
 
584
 
 
585
    def _unparse_url(self, path=None):
 
586
        if path is None:
 
587
            path = self._path
 
588
        path = urllib.quote(path)
 
589
        # handle homedir paths
 
590
        if not path.startswith('/'):
 
591
            path = "/~/" + path
 
592
        netloc = urllib.quote(self._host)
 
593
        if self._username is not None:
 
594
            netloc = '%s@%s' % (urllib.quote(self._username), netloc)
 
595
        if self._port is not None:
 
596
            netloc = '%s:%d' % (netloc, self._port)
 
597
        return urlparse.urlunparse(('sftp', netloc, path, '', '', ''))
 
598
 
 
599
    def _split_url(self, url):
 
600
        (scheme, username, password, host, port, path) = split_url(url)
 
601
        assert scheme == 'sftp'
 
602
 
 
603
        # the initial slash should be removed from the path, and treated
 
604
        # as a homedir relative path (the path begins with a double slash
 
605
        # if it is absolute).
 
606
        # see draft-ietf-secsh-scp-sftp-ssh-uri-03.txt
 
607
        # RBC 20060118 we are not using this as its too user hostile. instead
 
608
        # we are following lftp and using /~/foo to mean '~/foo'.
 
609
        # handle homedir paths
 
610
        if path.startswith('/~/'):
 
611
            path = path[3:]
 
612
        elif path == '/~':
 
613
            path = ''
 
614
        return (username, password, host, port, path)
 
615
 
 
616
    def _parse_url(self, url):
 
617
        (self._username, self._password,
 
618
         self._host, self._port, self._path) = self._split_url(url)
 
619
 
 
620
    def _sftp_connect(self):
 
621
        """Connect to the remote sftp server.
 
622
        After this, self._sftp should have a valid connection (or
 
623
        we raise an TransportError 'could not connect').
 
624
 
 
625
        TODO: Raise a more reasonable ConnectionFailed exception
 
626
        """
 
627
        self._sftp = _sftp_connect(self._host, self._port, self._username,
 
628
                self._password)
 
629
 
 
630
    def _sftp_open_exclusive(self, abspath, mode=None):
 
631
        """Open a remote path exclusively.
 
632
 
 
633
        SFTP supports O_EXCL (SFTP_FLAG_EXCL), which fails if
 
634
        the file already exists. However it does not expose this
 
635
        at the higher level of SFTPClient.open(), so we have to
 
636
        sneak away with it.
 
637
 
 
638
        WARNING: This breaks the SFTPClient abstraction, so it
 
639
        could easily break against an updated version of paramiko.
 
640
 
 
641
        :param abspath: The remote absolute path where the file should be opened
 
642
        :param mode: The mode permissions bits for the new file
 
643
        """
 
644
        path = self._sftp._adjust_cwd(abspath)
 
645
        # mutter('sftp abspath %s => %s', abspath, path)
 
646
        attr = SFTPAttributes()
 
647
        if mode is not None:
 
648
            attr.st_mode = mode
 
649
        omode = (SFTP_FLAG_WRITE | SFTP_FLAG_CREATE 
 
650
                | SFTP_FLAG_TRUNC | SFTP_FLAG_EXCL)
 
651
        try:
 
652
            t, msg = self._sftp._request(CMD_OPEN, path, omode, attr)
 
653
            if t != CMD_HANDLE:
 
654
                raise TransportError('Expected an SFTP handle')
 
655
            handle = msg.get_string()
 
656
            return SFTPFile(self._sftp, handle, 'wb', -1)
 
657
        except (paramiko.SSHException, IOError), e:
 
658
            self._translate_io_exception(e, abspath, ': unable to open',
 
659
                failure_exc=FileExists)
 
660
 
 
661
 
 
662
# ------------- server test implementation --------------
 
663
import threading
 
664
 
 
665
from bzrlib.tests.stub_sftp import StubServer, StubSFTPServer
 
666
 
 
667
STUB_SERVER_KEY = """
 
668
-----BEGIN RSA PRIVATE KEY-----
 
669
MIICWgIBAAKBgQDTj1bqB4WmayWNPB+8jVSYpZYk80Ujvj680pOTh2bORBjbIAyz
 
670
oWGW+GUjzKxTiiPvVmxFgx5wdsFvF03v34lEVVhMpouqPAYQ15N37K/ir5XY+9m/
 
671
d8ufMCkjeXsQkKqFbAlQcnWMCRnOoPHS3I4vi6hmnDDeeYTSRvfLbW0fhwIBIwKB
 
672
gBIiOqZYaoqbeD9OS9z2K9KR2atlTxGxOJPXiP4ESqP3NVScWNwyZ3NXHpyrJLa0
 
673
EbVtzsQhLn6rF+TzXnOlcipFvjsem3iYzCpuChfGQ6SovTcOjHV9z+hnpXvQ/fon
 
674
soVRZY65wKnF7IAoUwTmJS9opqgrN6kRgCd3DASAMd1bAkEA96SBVWFt/fJBNJ9H
 
675
tYnBKZGw0VeHOYmVYbvMSstssn8un+pQpUm9vlG/bp7Oxd/m+b9KWEh2xPfv6zqU
 
676
avNwHwJBANqzGZa/EpzF4J8pGti7oIAPUIDGMtfIcmqNXVMckrmzQ2vTfqtkEZsA
 
677
4rE1IERRyiJQx6EJsz21wJmGV9WJQ5kCQQDwkS0uXqVdFzgHO6S++tjmjYcxwr3g
 
678
H0CoFYSgbddOT6miqRskOQF3DZVkJT3kyuBgU2zKygz52ukQZMqxCb1fAkASvuTv
 
679
qfpH87Qq5kQhNKdbbwbmd2NxlNabazPijWuphGTdW0VfJdWfklyS2Kr+iqrs/5wV
 
680
HhathJt636Eg7oIjAkA8ht3MQ+XSl9yIJIS8gVpbPxSw5OMfw0PjVE7tBdQruiSc
 
681
nvuQES5C9BMHjF39LZiGH1iLQy7FgdHyoP+eodI7
 
682
-----END RSA PRIVATE KEY-----
 
683
"""
 
684
 
 
685
 
 
686
class SocketListener(threading.Thread):
 
687
 
 
688
    def __init__(self, callback):
 
689
        threading.Thread.__init__(self)
 
690
        self._callback = callback
 
691
        self._socket = socket.socket()
 
692
        self._socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
 
693
        self._socket.bind(('localhost', 0))
 
694
        self._socket.listen(1)
 
695
        self.port = self._socket.getsockname()[1]
 
696
        self._stop_event = threading.Event()
 
697
 
 
698
    def stop(self):
 
699
        # called from outside this thread
 
700
        self._stop_event.set()
 
701
        # use a timeout here, because if the test fails, the server thread may
 
702
        # never notice the stop_event.
 
703
        self.join(5.0)
 
704
        self._socket.close()
 
705
 
 
706
    def run(self):
 
707
        while True:
 
708
            readable, writable_unused, exception_unused = \
 
709
                select.select([self._socket], [], [], 0.1)
 
710
            if self._stop_event.isSet():
 
711
                return
 
712
            if len(readable) == 0:
 
713
                continue
 
714
            try:
 
715
                s, addr_unused = self._socket.accept()
 
716
                # because the loopback socket is inline, and transports are
 
717
                # never explicitly closed, best to launch a new thread.
 
718
                threading.Thread(target=self._callback, args=(s,)).start()
 
719
            except socket.error, x:
 
720
                sys.excepthook(*sys.exc_info())
 
721
                warning('Socket error during accept() within unit test server'
 
722
                        ' thread: %r' % x)
 
723
            except Exception, x:
 
724
                # probably a failed test; unit test thread will log the
 
725
                # failure/error
 
726
                sys.excepthook(*sys.exc_info())
 
727
                warning('Exception from within unit test server thread: %r' % 
 
728
                        x)
 
729
 
 
730
 
 
731
class SocketDelay(object):
 
732
    """A socket decorator to make TCP appear slower.
 
733
 
 
734
    This changes recv, send, and sendall to add a fixed latency to each python
 
735
    call if a new roundtrip is detected. That is, when a recv is called and the
 
736
    flag new_roundtrip is set, latency is charged. Every send and send_all
 
737
    sets this flag.
 
738
 
 
739
    In addition every send, sendall and recv sleeps a bit per character send to
 
740
    simulate bandwidth.
 
741
 
 
742
    Not all methods are implemented, this is deliberate as this class is not a
 
743
    replacement for the builtin sockets layer. fileno is not implemented to
 
744
    prevent the proxy being bypassed. 
 
745
    """
 
746
 
 
747
    simulated_time = 0
 
748
    _proxied_arguments = dict.fromkeys([
 
749
        "close", "getpeername", "getsockname", "getsockopt", "gettimeout",
 
750
        "setblocking", "setsockopt", "settimeout", "shutdown"])
 
751
 
 
752
    def __init__(self, sock, latency, bandwidth=1.0, 
 
753
                 really_sleep=True):
 
754
        """ 
 
755
        :param bandwith: simulated bandwith (MegaBit)
 
756
        :param really_sleep: If set to false, the SocketDelay will just
 
757
        increase a counter, instead of calling time.sleep. This is useful for
 
758
        unittesting the SocketDelay.
 
759
        """
 
760
        self.sock = sock
 
761
        self.latency = latency
 
762
        self.really_sleep = really_sleep
 
763
        self.time_per_byte = 1 / (bandwidth / 8.0 * 1024 * 1024) 
 
764
        self.new_roundtrip = False
 
765
 
 
766
    def sleep(self, s):
 
767
        if self.really_sleep:
 
768
            time.sleep(s)
 
769
        else:
 
770
            SocketDelay.simulated_time += s
 
771
 
 
772
    def __getattr__(self, attr):
 
773
        if attr in SocketDelay._proxied_arguments:
 
774
            return getattr(self.sock, attr)
 
775
        raise AttributeError("'SocketDelay' object has no attribute %r" %
 
776
                             attr)
 
777
 
 
778
    def dup(self):
 
779
        return SocketDelay(self.sock.dup(), self.latency, self.time_per_byte,
 
780
                           self._sleep)
 
781
 
 
782
    def recv(self, *args):
 
783
        data = self.sock.recv(*args)
 
784
        if data and self.new_roundtrip:
 
785
            self.new_roundtrip = False
 
786
            self.sleep(self.latency)
 
787
        self.sleep(len(data) * self.time_per_byte)
 
788
        return data
 
789
 
 
790
    def sendall(self, data, flags=0):
 
791
        if not self.new_roundtrip:
 
792
            self.new_roundtrip = True
 
793
            self.sleep(self.latency)
 
794
        self.sleep(len(data) * self.time_per_byte)
 
795
        return self.sock.sendall(data, flags)
 
796
 
 
797
    def send(self, data, flags=0):
 
798
        if not self.new_roundtrip:
 
799
            self.new_roundtrip = True
 
800
            self.sleep(self.latency)
 
801
        bytes_sent = self.sock.send(data, flags)
 
802
        self.sleep(bytes_sent * self.time_per_byte)
 
803
        return bytes_sent
 
804
 
 
805
 
 
806
class SFTPServer(Server):
 
807
    """Common code for SFTP server facilities."""
 
808
 
 
809
    def __init__(self):
 
810
        self._original_vendor = None
 
811
        self._homedir = None
 
812
        self._server_homedir = None
 
813
        self._listener = None
 
814
        self._root = None
 
815
        self._vendor = ssh.ParamikoVendor()
 
816
        # sftp server logs
 
817
        self.logs = []
 
818
        self.add_latency = 0
 
819
 
 
820
    def _get_sftp_url(self, path):
 
821
        """Calculate an sftp url to this server for path."""
 
822
        return 'sftp://foo:bar@localhost:%d/%s' % (self._listener.port, path)
 
823
 
 
824
    def log(self, message):
 
825
        """StubServer uses this to log when a new server is created."""
 
826
        self.logs.append(message)
 
827
 
 
828
    def _run_server_entry(self, sock):
 
829
        """Entry point for all implementations of _run_server.
 
830
        
 
831
        If self.add_latency is > 0.000001 then sock is given a latency adding
 
832
        decorator.
 
833
        """
 
834
        if self.add_latency > 0.000001:
 
835
            sock = SocketDelay(sock, self.add_latency)
 
836
        return self._run_server(sock)
 
837
 
 
838
    def _run_server(self, s):
 
839
        ssh_server = paramiko.Transport(s)
 
840
        key_file = pathjoin(self._homedir, 'test_rsa.key')
 
841
        f = open(key_file, 'w')
 
842
        f.write(STUB_SERVER_KEY)
 
843
        f.close()
 
844
        host_key = paramiko.RSAKey.from_private_key_file(key_file)
 
845
        ssh_server.add_server_key(host_key)
 
846
        server = StubServer(self)
 
847
        ssh_server.set_subsystem_handler('sftp', paramiko.SFTPServer,
 
848
                                         StubSFTPServer, root=self._root,
 
849
                                         home=self._server_homedir)
 
850
        event = threading.Event()
 
851
        ssh_server.start_server(event, server)
 
852
        event.wait(5.0)
 
853
    
 
854
    def setUp(self):
 
855
        self._original_vendor = ssh._ssh_vendor
 
856
        ssh._ssh_vendor = self._vendor
 
857
        if sys.platform == 'win32':
 
858
            # Win32 needs to use the UNICODE api
 
859
            self._homedir = getcwd()
 
860
        else:
 
861
            # But Linux SFTP servers should just deal in bytestreams
 
862
            self._homedir = os.getcwd()
 
863
        if self._server_homedir is None:
 
864
            self._server_homedir = self._homedir
 
865
        self._root = '/'
 
866
        if sys.platform == 'win32':
 
867
            self._root = ''
 
868
        self._listener = SocketListener(self._run_server_entry)
 
869
        self._listener.setDaemon(True)
 
870
        self._listener.start()
 
871
 
 
872
    def tearDown(self):
 
873
        """See bzrlib.transport.Server.tearDown."""
 
874
        self._listener.stop()
 
875
        ssh._ssh_vendor = self._original_vendor
 
876
 
 
877
    def get_bogus_url(self):
 
878
        """See bzrlib.transport.Server.get_bogus_url."""
 
879
        # this is chosen to try to prevent trouble with proxies, wierd dns, etc
 
880
        # we bind a random socket, so that we get a guaranteed unused port
 
881
        # we just never listen on that port
 
882
        s = socket.socket()
 
883
        s.bind(('localhost', 0))
 
884
        return 'sftp://%s:%s/' % s.getsockname()
 
885
 
 
886
 
 
887
class SFTPFullAbsoluteServer(SFTPServer):
 
888
    """A test server for sftp transports, using absolute urls and ssh."""
 
889
 
 
890
    def get_url(self):
 
891
        """See bzrlib.transport.Server.get_url."""
 
892
        return self._get_sftp_url(urlutils.escape(self._homedir[1:]))
 
893
 
 
894
 
 
895
class SFTPServerWithoutSSH(SFTPServer):
 
896
    """An SFTP server that uses a simple TCP socket pair rather than SSH."""
 
897
 
 
898
    def __init__(self):
 
899
        super(SFTPServerWithoutSSH, self).__init__()
 
900
        self._vendor = ssh.LoopbackVendor()
 
901
 
 
902
    def _run_server(self, sock):
 
903
        # Re-import these as locals, so that they're still accessible during
 
904
        # interpreter shutdown (when all module globals get set to None, leading
 
905
        # to confusing errors like "'NoneType' object has no attribute 'error'".
 
906
        import socket, errno
 
907
        class FakeChannel(object):
 
908
            def get_transport(self):
 
909
                return self
 
910
            def get_log_channel(self):
 
911
                return 'paramiko'
 
912
            def get_name(self):
 
913
                return '1'
 
914
            def get_hexdump(self):
 
915
                return False
 
916
            def close(self):
 
917
                pass
 
918
 
 
919
        server = paramiko.SFTPServer(FakeChannel(), 'sftp', StubServer(self), StubSFTPServer,
 
920
                                     root=self._root, home=self._server_homedir)
 
921
        try:
 
922
            server.start_subsystem('sftp', None, sock)
 
923
        except socket.error, e:
 
924
            if (len(e.args) > 0) and (e.args[0] == errno.EPIPE):
 
925
                # it's okay for the client to disconnect abruptly
 
926
                # (bug in paramiko 1.6: it should absorb this exception)
 
927
                pass
 
928
            else:
 
929
                raise
 
930
        except Exception, e:
 
931
            import sys; sys.stderr.write('\nEXCEPTION %r\n\n' % e.__class__)
 
932
        server.finish_subsystem()
 
933
 
 
934
 
 
935
class SFTPAbsoluteServer(SFTPServerWithoutSSH):
 
936
    """A test server for sftp transports, using absolute urls."""
 
937
 
 
938
    def get_url(self):
 
939
        """See bzrlib.transport.Server.get_url."""
 
940
        if sys.platform == 'win32':
 
941
            return self._get_sftp_url(urlutils.escape(self._homedir))
 
942
        else:
 
943
            return self._get_sftp_url(urlutils.escape(self._homedir[1:]))
 
944
 
 
945
 
 
946
class SFTPHomeDirServer(SFTPServerWithoutSSH):
 
947
    """A test server for sftp transports, using homedir relative urls."""
 
948
 
 
949
    def get_url(self):
 
950
        """See bzrlib.transport.Server.get_url."""
 
951
        return self._get_sftp_url("~/")
 
952
 
 
953
 
 
954
class SFTPSiblingAbsoluteServer(SFTPAbsoluteServer):
 
955
    """A test servere for sftp transports, using absolute urls to non-home."""
 
956
 
 
957
    def setUp(self):
 
958
        self._server_homedir = '/dev/noone/runs/tests/here'
 
959
        super(SFTPSiblingAbsoluteServer, self).setUp()
 
960
 
 
961
 
 
962
def _sftp_connect(host, port, username, password):
 
963
    """Connect to the remote sftp server.
 
964
 
 
965
    :raises: a TransportError 'could not connect'.
 
966
 
 
967
    :returns: an paramiko.sftp_client.SFTPClient
 
968
 
 
969
    TODO: Raise a more reasonable ConnectionFailed exception
 
970
    """
 
971
    idx = (host, port, username)
 
972
    try:
 
973
        return _connected_hosts[idx]
 
974
    except KeyError:
 
975
        pass
 
976
    
 
977
    sftp = _sftp_connect_uncached(host, port, username, password)
 
978
    _connected_hosts[idx] = sftp
 
979
    return sftp
 
980
 
 
981
def _sftp_connect_uncached(host, port, username, password):
 
982
    vendor = ssh._get_ssh_vendor()
 
983
    sftp = vendor.connect_sftp(username, password, host, port)
 
984
    return sftp
 
985
 
 
986
 
 
987
def get_test_permutations():
 
988
    """Return the permutations to be used in testing."""
 
989
    return [(SFTPTransport, SFTPAbsoluteServer),
 
990
            (SFTPTransport, SFTPHomeDirServer),
 
991
            (SFTPTransport, SFTPSiblingAbsoluteServer),
 
992
            ]