/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

Merge Aarons integration branch.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Bazaar-NG -- distributed version control
 
2
#
 
3
# Copyright (C) 2005 by Canonical Ltd
 
4
#
 
5
# This program is free software; you can redistribute it and/or modify
 
6
# it under the terms of the GNU General Public License as published by
 
7
# the Free Software Foundation; either version 2 of the License, or
 
8
# (at your option) any later version.
 
9
#
 
10
# This program is distributed in the hope that it will be useful,
 
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
# GNU General Public License for more details.
 
14
#
 
15
# You should have received a copy of the GNU General Public License
 
16
# along with this program; if not, write to the Free Software
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 
 
19
from shutil import copyfile
 
20
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
 
21
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
 
22
from cStringIO import StringIO
 
23
import errno
 
24
import os
 
25
import re
 
26
import sha
 
27
import string
 
28
import sys
 
29
import time
 
30
import types
 
31
import tempfile
 
32
 
 
33
import bzrlib
 
34
from bzrlib.errors import BzrError, PathNotChild, NoSuchFile
 
35
from bzrlib.trace import mutter
 
36
 
 
37
 
 
38
def make_readonly(filename):
 
39
    """Make a filename read-only."""
 
40
    mod = os.stat(filename).st_mode
 
41
    mod = mod & 0777555
 
42
    os.chmod(filename, mod)
 
43
 
 
44
 
 
45
def make_writable(filename):
 
46
    mod = os.stat(filename).st_mode
 
47
    mod = mod | 0200
 
48
    os.chmod(filename, mod)
 
49
 
 
50
 
 
51
_QUOTE_RE = None
 
52
 
 
53
 
 
54
def quotefn(f):
 
55
    """Return a quoted filename filename
 
56
 
 
57
    This previously used backslash quoting, but that works poorly on
 
58
    Windows."""
 
59
    # TODO: I'm not really sure this is the best format either.x
 
60
    global _QUOTE_RE
 
61
    if _QUOTE_RE == None:
 
62
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
 
63
        
 
64
    if _QUOTE_RE.search(f):
 
65
        return '"' + f + '"'
 
66
    else:
 
67
        return f
 
68
 
 
69
 
 
70
def file_kind(f):
 
71
    mode = os.lstat(f)[ST_MODE]
 
72
    if S_ISREG(mode):
 
73
        return 'file'
 
74
    elif S_ISDIR(mode):
 
75
        return 'directory'
 
76
    elif S_ISLNK(mode):
 
77
        return 'symlink'
 
78
    elif S_ISCHR(mode):
 
79
        return 'chardev'
 
80
    elif S_ISBLK(mode):
 
81
        return 'block'
 
82
    elif S_ISFIFO(mode):
 
83
        return 'fifo'
 
84
    elif S_ISSOCK(mode):
 
85
        return 'socket'
 
86
    else:
 
87
        return 'unknown'
 
88
 
 
89
 
 
90
def kind_marker(kind):
 
91
    if kind == 'file':
 
92
        return ''
 
93
    elif kind == 'directory':
 
94
        return '/'
 
95
    elif kind == 'symlink':
 
96
        return '@'
 
97
    else:
 
98
        raise BzrError('invalid file kind %r' % kind)
 
99
 
 
100
def lexists(f):
 
101
    if hasattr(os.path, 'lexists'):
 
102
        return os.path.lexists(f)
 
103
    try:
 
104
        if hasattr(os, 'lstat'):
 
105
            os.lstat(f)
 
106
        else:
 
107
            os.stat(f)
 
108
        return True
 
109
    except OSError,e:
 
110
        if e.errno == errno.ENOENT:
 
111
            return False;
 
112
        else:
 
113
            raise BzrError("lstat/stat of (%r): %r" % (f, e))
 
114
 
 
115
def fancy_rename(old, new, rename_func, unlink_func):
 
116
    """A fancy rename, when you don't have atomic rename.
 
117
    
 
118
    :param old: The old path, to rename from
 
119
    :param new: The new path, to rename to
 
120
    :param rename_func: The potentially non-atomic rename function
 
121
    :param unlink_func: A way to delete the target file if the full rename succeeds
 
122
    """
 
123
 
 
124
    # sftp rename doesn't allow overwriting, so play tricks:
 
125
    import random
 
126
    base = os.path.basename(new)
 
127
    dirname = os.path.dirname(new)
 
128
    tmp_name = u'tmp.%s.%.9f.%d.%d' % (base, time.time(), os.getpid(), random.randint(0, 0x7FFFFFFF))
 
129
    tmp_name = pathjoin(dirname, tmp_name)
 
130
 
 
131
    # Rename the file out of the way, but keep track if it didn't exist
 
132
    # We don't want to grab just any exception
 
133
    # something like EACCES should prevent us from continuing
 
134
    # The downside is that the rename_func has to throw an exception
 
135
    # with an errno = ENOENT, or NoSuchFile
 
136
    file_existed = False
 
137
    try:
 
138
        rename_func(new, tmp_name)
 
139
    except (NoSuchFile,), e:
 
140
        pass
 
141
    except IOError, e:
 
142
        # RBC 20060103 abstraction leakage: the paramiko SFTP clients rename
 
143
        # function raises an IOError with errno == None when a rename fails.
 
144
        # This then gets caught here.
 
145
        if e.errno is not None:
 
146
            raise
 
147
    except Exception, e:
 
148
        if (not hasattr(e, 'errno') 
 
149
            or e.errno not in (errno.ENOENT, errno.ENOTDIR)):
 
150
            raise
 
151
    else:
 
152
        file_existed = True
 
153
 
 
154
    success = False
 
155
    try:
 
156
        # This may throw an exception, in which case success will
 
157
        # not be set.
 
158
        rename_func(old, new)
 
159
        success = True
 
160
    finally:
 
161
        if file_existed:
 
162
            # If the file used to exist, rename it back into place
 
163
            # otherwise just delete it from the tmp location
 
164
            if success:
 
165
                unlink_func(tmp_name)
 
166
            else:
 
167
                rename_func(tmp_name, new)
 
168
 
 
169
# Default is to just use the python builtins
 
170
abspath = os.path.abspath
 
171
realpath = os.path.realpath
 
172
pathjoin = os.path.join
 
173
normpath = os.path.normpath
 
174
getcwd = os.getcwdu
 
175
mkdtemp = tempfile.mkdtemp
 
176
rename = os.rename
 
177
dirname = os.path.dirname
 
178
basename = os.path.basename
 
179
 
 
180
if os.name == "posix":
 
181
    # In Python 2.4.2 and older, os.path.abspath and os.path.realpath
 
182
    # choke on a Unicode string containing a relative path if
 
183
    # os.getcwd() returns a non-sys.getdefaultencoding()-encoded
 
184
    # string.
 
185
    _fs_enc = sys.getfilesystemencoding()
 
186
    def abspath(path):
 
187
        return os.path.abspath(path.encode(_fs_enc)).decode(_fs_enc)
 
188
 
 
189
    def realpath(path):
 
190
        return os.path.realpath(path.encode(_fs_enc)).decode(_fs_enc)
 
191
 
 
192
if sys.platform == 'win32':
 
193
    # We need to use the Unicode-aware os.path.abspath and
 
194
    # os.path.realpath on Windows systems.
 
195
    def abspath(path):
 
196
        return os.path.abspath(path).replace('\\', '/')
 
197
 
 
198
    def realpath(path):
 
199
        return os.path.realpath(path).replace('\\', '/')
 
200
 
 
201
    def pathjoin(*args):
 
202
        return os.path.join(*args).replace('\\', '/')
 
203
 
 
204
    def normpath(path):
 
205
        return os.path.normpath(path).replace('\\', '/')
 
206
 
 
207
    def getcwd():
 
208
        return os.getcwdu().replace('\\', '/')
 
209
 
 
210
    def mkdtemp(*args, **kwargs):
 
211
        return tempfile.mkdtemp(*args, **kwargs).replace('\\', '/')
 
212
 
 
213
    def rename(old, new):
 
214
        fancy_rename(old, new, rename_func=os.rename, unlink_func=os.unlink)
 
215
 
 
216
 
 
217
def normalizepath(f):
 
218
    if hasattr(os.path, 'realpath'):
 
219
        F = realpath
 
220
    else:
 
221
        F = abspath
 
222
    [p,e] = os.path.split(f)
 
223
    if e == "" or e == "." or e == "..":
 
224
        return F(f)
 
225
    else:
 
226
        return pathjoin(F(p), e)
 
227
 
 
228
 
 
229
def backup_file(fn):
 
230
    """Copy a file to a backup.
 
231
 
 
232
    Backups are named in GNU-style, with a ~ suffix.
 
233
 
 
234
    If the file is already a backup, it's not copied.
 
235
    """
 
236
    if fn[-1] == '~':
 
237
        return
 
238
    bfn = fn + '~'
 
239
 
 
240
    if has_symlinks() and os.path.islink(fn):
 
241
        target = os.readlink(fn)
 
242
        os.symlink(target, bfn)
 
243
        return
 
244
    inf = file(fn, 'rb')
 
245
    try:
 
246
        content = inf.read()
 
247
    finally:
 
248
        inf.close()
 
249
    
 
250
    outf = file(bfn, 'wb')
 
251
    try:
 
252
        outf.write(content)
 
253
    finally:
 
254
        outf.close()
 
255
 
 
256
 
 
257
def isdir(f):
 
258
    """True if f is an accessible directory."""
 
259
    try:
 
260
        return S_ISDIR(os.lstat(f)[ST_MODE])
 
261
    except OSError:
 
262
        return False
 
263
 
 
264
 
 
265
def isfile(f):
 
266
    """True if f is a regular file."""
 
267
    try:
 
268
        return S_ISREG(os.lstat(f)[ST_MODE])
 
269
    except OSError:
 
270
        return False
 
271
 
 
272
def islink(f):
 
273
    """True if f is a symlink."""
 
274
    try:
 
275
        return S_ISLNK(os.lstat(f)[ST_MODE])
 
276
    except OSError:
 
277
        return False
 
278
 
 
279
def is_inside(dir, fname):
 
280
    """True if fname is inside dir.
 
281
    
 
282
    The parameters should typically be passed to osutils.normpath first, so
 
283
    that . and .. and repeated slashes are eliminated, and the separators
 
284
    are canonical for the platform.
 
285
    
 
286
    The empty string as a dir name is taken as top-of-tree and matches 
 
287
    everything.
 
288
    
 
289
    >>> is_inside('src', pathjoin('src', 'foo.c'))
 
290
    True
 
291
    >>> is_inside('src', 'srccontrol')
 
292
    False
 
293
    >>> is_inside('src', pathjoin('src', 'a', 'a', 'a', 'foo.c'))
 
294
    True
 
295
    >>> is_inside('foo.c', 'foo.c')
 
296
    True
 
297
    >>> is_inside('foo.c', '')
 
298
    False
 
299
    >>> is_inside('', 'foo.c')
 
300
    True
 
301
    """
 
302
    # XXX: Most callers of this can actually do something smarter by 
 
303
    # looking at the inventory
 
304
    if dir == fname:
 
305
        return True
 
306
    
 
307
    if dir == '':
 
308
        return True
 
309
 
 
310
    if dir[-1] != '/':
 
311
        dir += '/'
 
312
 
 
313
    return fname.startswith(dir)
 
314
 
 
315
 
 
316
def is_inside_any(dir_list, fname):
 
317
    """True if fname is inside any of given dirs."""
 
318
    for dirname in dir_list:
 
319
        if is_inside(dirname, fname):
 
320
            return True
 
321
    else:
 
322
        return False
 
323
 
 
324
 
 
325
def pumpfile(fromfile, tofile):
 
326
    """Copy contents of one file to another."""
 
327
    BUFSIZE = 32768
 
328
    while True:
 
329
        b = fromfile.read(BUFSIZE)
 
330
        if not b:
 
331
            break
 
332
        tofile.write(b)
 
333
 
 
334
 
 
335
def sha_file(f):
 
336
    if hasattr(f, 'tell'):
 
337
        assert f.tell() == 0
 
338
    s = sha.new()
 
339
    BUFSIZE = 128<<10
 
340
    while True:
 
341
        b = f.read(BUFSIZE)
 
342
        if not b:
 
343
            break
 
344
        s.update(b)
 
345
    return s.hexdigest()
 
346
 
 
347
 
 
348
 
 
349
def sha_strings(strings):
 
350
    """Return the sha-1 of concatenation of strings"""
 
351
    s = sha.new()
 
352
    map(s.update, strings)
 
353
    return s.hexdigest()
 
354
 
 
355
 
 
356
def sha_string(f):
 
357
    s = sha.new()
 
358
    s.update(f)
 
359
    return s.hexdigest()
 
360
 
 
361
 
 
362
def fingerprint_file(f):
 
363
    s = sha.new()
 
364
    b = f.read()
 
365
    s.update(b)
 
366
    size = len(b)
 
367
    return {'size': size,
 
368
            'sha1': s.hexdigest()}
 
369
 
 
370
 
 
371
def compare_files(a, b):
 
372
    """Returns true if equal in contents"""
 
373
    BUFSIZE = 4096
 
374
    while True:
 
375
        ai = a.read(BUFSIZE)
 
376
        bi = b.read(BUFSIZE)
 
377
        if ai != bi:
 
378
            return False
 
379
        if ai == '':
 
380
            return True
 
381
 
 
382
 
 
383
def local_time_offset(t=None):
 
384
    """Return offset of local zone from GMT, either at present or at time t."""
 
385
    # python2.3 localtime() can't take None
 
386
    if t == None:
 
387
        t = time.time()
 
388
        
 
389
    if time.localtime(t).tm_isdst and time.daylight:
 
390
        return -time.altzone
 
391
    else:
 
392
        return -time.timezone
 
393
 
 
394
    
 
395
def format_date(t, offset=0, timezone='original', date_fmt=None, 
 
396
                show_offset=True):
 
397
    ## TODO: Perhaps a global option to use either universal or local time?
 
398
    ## Or perhaps just let people set $TZ?
 
399
    assert isinstance(t, float)
 
400
    
 
401
    if timezone == 'utc':
 
402
        tt = time.gmtime(t)
 
403
        offset = 0
 
404
    elif timezone == 'original':
 
405
        if offset == None:
 
406
            offset = 0
 
407
        tt = time.gmtime(t + offset)
 
408
    elif timezone == 'local':
 
409
        tt = time.localtime(t)
 
410
        offset = local_time_offset(t)
 
411
    else:
 
412
        raise BzrError("unsupported timezone format %r" % timezone,
 
413
                       ['options are "utc", "original", "local"'])
 
414
    if date_fmt is None:
 
415
        date_fmt = "%a %Y-%m-%d %H:%M:%S"
 
416
    if show_offset:
 
417
        offset_str = ' %+03d%02d' % (offset / 3600, (offset / 60) % 60)
 
418
    else:
 
419
        offset_str = ''
 
420
    return (time.strftime(date_fmt, tt) +  offset_str)
 
421
 
 
422
 
 
423
def compact_date(when):
 
424
    return time.strftime('%Y%m%d%H%M%S', time.gmtime(when))
 
425
    
 
426
 
 
427
 
 
428
def filesize(f):
 
429
    """Return size of given open file."""
 
430
    return os.fstat(f.fileno())[ST_SIZE]
 
431
 
 
432
# Define rand_bytes based on platform.
 
433
try:
 
434
    # Python 2.4 and later have os.urandom,
 
435
    # but it doesn't work on some arches
 
436
    os.urandom(1)
 
437
    rand_bytes = os.urandom
 
438
except (NotImplementedError, AttributeError):
 
439
    # If python doesn't have os.urandom, or it doesn't work,
 
440
    # then try to first pull random data from /dev/urandom
 
441
    if os.path.exists("/dev/urandom"):
 
442
        rand_bytes = file('/dev/urandom', 'rb').read
 
443
    # Otherwise, use this hack as a last resort
 
444
    else:
 
445
        # not well seeded, but better than nothing
 
446
        def rand_bytes(n):
 
447
            import random
 
448
            s = ''
 
449
            while n:
 
450
                s += chr(random.randint(0, 255))
 
451
                n -= 1
 
452
            return s
 
453
 
 
454
## TODO: We could later have path objects that remember their list
 
455
## decomposition (might be too tricksy though.)
 
456
 
 
457
def splitpath(p):
 
458
    """Turn string into list of parts.
 
459
 
 
460
    >>> splitpath('a')
 
461
    ['a']
 
462
    >>> splitpath('a/b')
 
463
    ['a', 'b']
 
464
    >>> splitpath('a/./b')
 
465
    ['a', 'b']
 
466
    >>> splitpath('a/.b')
 
467
    ['a', '.b']
 
468
    >>> splitpath('a/../b')
 
469
    Traceback (most recent call last):
 
470
    ...
 
471
    BzrError: sorry, '..' not allowed in path
 
472
    """
 
473
    assert isinstance(p, types.StringTypes)
 
474
 
 
475
    # split on either delimiter because people might use either on
 
476
    # Windows
 
477
    ps = re.split(r'[\\/]', p)
 
478
 
 
479
    rps = []
 
480
    for f in ps:
 
481
        if f == '..':
 
482
            raise BzrError("sorry, %r not allowed in path" % f)
 
483
        elif (f == '.') or (f == ''):
 
484
            pass
 
485
        else:
 
486
            rps.append(f)
 
487
    return rps
 
488
 
 
489
def joinpath(p):
 
490
    assert isinstance(p, list)
 
491
    for f in p:
 
492
        if (f == '..') or (f == None) or (f == ''):
 
493
            raise BzrError("sorry, %r not allowed in path" % f)
 
494
    return pathjoin(*p)
 
495
 
 
496
 
 
497
def appendpath(p1, p2):
 
498
    if p1 == '':
 
499
        return p2
 
500
    else:
 
501
        return pathjoin(p1, p2)
 
502
    
 
503
 
 
504
def split_lines(s):
 
505
    """Split s into lines, but without removing the newline characters."""
 
506
    return StringIO(s).readlines()
 
507
 
 
508
 
 
509
def hardlinks_good():
 
510
    return sys.platform not in ('win32', 'cygwin', 'darwin')
 
511
 
 
512
 
 
513
def link_or_copy(src, dest):
 
514
    """Hardlink a file, or copy it if it can't be hardlinked."""
 
515
    if not hardlinks_good():
 
516
        copyfile(src, dest)
 
517
        return
 
518
    try:
 
519
        os.link(src, dest)
 
520
    except (OSError, IOError), e:
 
521
        if e.errno != errno.EXDEV:
 
522
            raise
 
523
        copyfile(src, dest)
 
524
 
 
525
 
 
526
def has_symlinks():
 
527
    if hasattr(os, 'symlink'):
 
528
        return True
 
529
    else:
 
530
        return False
 
531
        
 
532
 
 
533
def contains_whitespace(s):
 
534
    """True if there are any whitespace characters in s."""
 
535
    for ch in string.whitespace:
 
536
        if ch in s:
 
537
            return True
 
538
    else:
 
539
        return False
 
540
 
 
541
 
 
542
def contains_linebreaks(s):
 
543
    """True if there is any vertical whitespace in s."""
 
544
    for ch in '\f\n\r':
 
545
        if ch in s:
 
546
            return True
 
547
    else:
 
548
        return False
 
549
 
 
550
 
 
551
def relpath(base, path):
 
552
    """Return path relative to base, or raise exception.
 
553
 
 
554
    The path may be either an absolute path or a path relative to the
 
555
    current working directory.
 
556
 
 
557
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
558
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
559
    avoids that problem."""
 
560
    rp = abspath(path)
 
561
 
 
562
    s = []
 
563
    head = rp
 
564
    while len(head) >= len(base):
 
565
        if head == base:
 
566
            break
 
567
        head, tail = os.path.split(head)
 
568
        if tail:
 
569
            s.insert(0, tail)
 
570
    else:
 
571
        # XXX This should raise a NotChildPath exception, as its not tied
 
572
        # to branch anymore.
 
573
        raise PathNotChild(rp, base)
 
574
 
 
575
    if s:
 
576
        return pathjoin(*s)
 
577
    else:
 
578
        return ''
 
579
 
 
580
 
 
581
def terminal_width():
 
582
    """Return estimated terminal width."""
 
583
 
 
584
    # TODO: Do something smart on Windows?
 
585
 
 
586
    # TODO: Is there anything that gets a better update when the window
 
587
    # is resized while the program is running? We could use the Python termcap
 
588
    # library.
 
589
    try:
 
590
        return int(os.environ['COLUMNS'])
 
591
    except (IndexError, KeyError, ValueError):
 
592
        return 80