/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

Merge from integration, mode-changes are broken.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Bazaar-NG -- distributed version control
 
2
#
 
3
# Copyright (C) 2005 by Canonical Ltd
 
4
#
 
5
# This program is free software; you can redistribute it and/or modify
 
6
# it under the terms of the GNU General Public License as published by
 
7
# the Free Software Foundation; either version 2 of the License, or
 
8
# (at your option) any later version.
 
9
#
 
10
# This program is distributed in the hope that it will be useful,
 
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
# GNU General Public License for more details.
 
14
#
 
15
# You should have received a copy of the GNU General Public License
 
16
# along with this program; if not, write to the Free Software
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 
 
19
from shutil import copyfile
 
20
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
 
21
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
 
22
from cStringIO import StringIO
 
23
import errno
 
24
import os
 
25
import re
 
26
import sha
 
27
import string
 
28
import sys
 
29
import time
 
30
import types
 
31
import tempfile
 
32
 
 
33
import bzrlib
 
34
from bzrlib.errors import BzrError, PathNotChild, NoSuchFile
 
35
from bzrlib.trace import mutter
 
36
 
 
37
 
 
38
def make_readonly(filename):
 
39
    """Make a filename read-only."""
 
40
    mod = os.stat(filename).st_mode
 
41
    mod = mod & 0777555
 
42
    os.chmod(filename, mod)
 
43
 
 
44
 
 
45
def make_writable(filename):
 
46
    mod = os.stat(filename).st_mode
 
47
    mod = mod | 0200
 
48
    os.chmod(filename, mod)
 
49
 
 
50
 
 
51
_QUOTE_RE = None
 
52
 
 
53
 
 
54
def quotefn(f):
 
55
    """Return a quoted filename filename
 
56
 
 
57
    This previously used backslash quoting, but that works poorly on
 
58
    Windows."""
 
59
    # TODO: I'm not really sure this is the best format either.x
 
60
    global _QUOTE_RE
 
61
    if _QUOTE_RE == None:
 
62
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
 
63
        
 
64
    if _QUOTE_RE.search(f):
 
65
        return '"' + f + '"'
 
66
    else:
 
67
        return f
 
68
 
 
69
 
 
70
def file_kind(f):
 
71
    mode = os.lstat(f)[ST_MODE]
 
72
    if S_ISREG(mode):
 
73
        return 'file'
 
74
    elif S_ISDIR(mode):
 
75
        return 'directory'
 
76
    elif S_ISLNK(mode):
 
77
        return 'symlink'
 
78
    elif S_ISCHR(mode):
 
79
        return 'chardev'
 
80
    elif S_ISBLK(mode):
 
81
        return 'block'
 
82
    elif S_ISFIFO(mode):
 
83
        return 'fifo'
 
84
    elif S_ISSOCK(mode):
 
85
        return 'socket'
 
86
    else:
 
87
        return 'unknown'
 
88
 
 
89
 
 
90
def kind_marker(kind):
 
91
    if kind == 'file':
 
92
        return ''
 
93
    elif kind == 'directory':
 
94
        return '/'
 
95
    elif kind == 'symlink':
 
96
        return '@'
 
97
    else:
 
98
        raise BzrError('invalid file kind %r' % kind)
 
99
 
 
100
def lexists(f):
 
101
    if hasattr(os.path, 'lexists'):
 
102
        return os.path.lexists(f)
 
103
    try:
 
104
        if hasattr(os, 'lstat'):
 
105
            os.lstat(f)
 
106
        else:
 
107
            os.stat(f)
 
108
        return True
 
109
    except OSError,e:
 
110
        if e.errno == errno.ENOENT:
 
111
            return False;
 
112
        else:
 
113
            raise BzrError("lstat/stat of (%r): %r" % (f, e))
 
114
 
 
115
def fancy_rename(old, new, rename_func, unlink_func):
 
116
    """A fancy rename, when you don't have atomic rename.
 
117
    
 
118
    :param old: The old path, to rename from
 
119
    :param new: The new path, to rename to
 
120
    :param rename_func: The potentially non-atomic rename function
 
121
    :param unlink_func: A way to delete the target file if the full rename succeeds
 
122
    """
 
123
 
 
124
    # sftp rename doesn't allow overwriting, so play tricks:
 
125
    import random
 
126
    base = os.path.basename(new)
 
127
    dirname = os.path.dirname(new)
 
128
    tmp_name = u'tmp.%s.%.9f.%d.%d' % (base, time.time(), os.getpid(), random.randint(0, 0x7FFFFFFF))
 
129
    tmp_name = pathjoin(dirname, tmp_name)
 
130
 
 
131
    # Rename the file out of the way, but keep track if it didn't exist
 
132
    # We don't want to grab just any exception
 
133
    # something like EACCES should prevent us from continuing
 
134
    # The downside is that the rename_func has to throw an exception
 
135
    # with an errno = ENOENT, or NoSuchFile
 
136
    file_existed = False
 
137
    try:
 
138
        rename_func(new, tmp_name)
 
139
    except (NoSuchFile,), e:
 
140
        pass
 
141
    except IOError, e:
 
142
        # RBC 20060103 abstraction leakage: the paramiko SFTP clients rename
 
143
        # function raises an IOError with errno == None when a rename fails.
 
144
        # This then gets caught here.
 
145
        if e.errno is not None:
 
146
            raise
 
147
    except Exception, e:
 
148
        if (not hasattr(e, 'errno') 
 
149
            or e.errno not in (errno.ENOENT, errno.ENOTDIR)):
 
150
            raise
 
151
    else:
 
152
        file_existed = True
 
153
 
 
154
    success = False
 
155
    try:
 
156
        # This may throw an exception, in which case success will
 
157
        # not be set.
 
158
        rename_func(old, new)
 
159
        success = True
 
160
    finally:
 
161
        if file_existed:
 
162
            # If the file used to exist, rename it back into place
 
163
            # otherwise just delete it from the tmp location
 
164
            if success:
 
165
                unlink_func(tmp_name)
 
166
            else:
 
167
                rename_func(tmp_name, new)
 
168
 
 
169
# Default is to just use the python builtins
 
170
abspath = os.path.abspath
 
171
realpath = os.path.realpath
 
172
pathjoin = os.path.join
 
173
normpath = os.path.normpath
 
174
getcwd = os.getcwdu
 
175
mkdtemp = tempfile.mkdtemp
 
176
rename = os.rename
 
177
dirname = os.path.dirname
 
178
basename = os.path.basename
 
179
 
 
180
if os.name == "posix":
 
181
    # In Python 2.4.2 and older, os.path.abspath and os.path.realpath
 
182
    # choke on a Unicode string containing a relative path if
 
183
    # os.getcwd() returns a non-sys.getdefaultencoding()-encoded
 
184
    # string.
 
185
    _fs_enc = sys.getfilesystemencoding()
 
186
    def abspath(path):
 
187
        return os.path.abspath(path.encode(_fs_enc)).decode(_fs_enc)
 
188
 
 
189
    def realpath(path):
 
190
        return os.path.realpath(path.encode(_fs_enc)).decode(_fs_enc)
 
191
 
 
192
if sys.platform == 'win32':
 
193
    # We need to use the Unicode-aware os.path.abspath and
 
194
    # os.path.realpath on Windows systems.
 
195
    def abspath(path):
 
196
        return os.path.abspath(path).replace('\\', '/')
 
197
 
 
198
    def realpath(path):
 
199
        return os.path.realpath(path).replace('\\', '/')
 
200
 
 
201
    def pathjoin(*args):
 
202
        return os.path.join(*args).replace('\\', '/')
 
203
 
 
204
    def normpath(path):
 
205
        return os.path.normpath(path).replace('\\', '/')
 
206
 
 
207
    def getcwd():
 
208
        return os.getcwdu().replace('\\', '/')
 
209
 
 
210
    def mkdtemp(*args, **kwargs):
 
211
        return tempfile.mkdtemp(*args, **kwargs).replace('\\', '/')
 
212
 
 
213
    def rename(old, new):
 
214
        fancy_rename(old, new, rename_func=os.rename, unlink_func=os.unlink)
 
215
 
 
216
 
 
217
def normalizepath(f):
 
218
    if hasattr(os.path, 'realpath'):
 
219
        F = realpath
 
220
    else:
 
221
        F = abspath
 
222
    [p,e] = os.path.split(f)
 
223
    if e == "" or e == "." or e == "..":
 
224
        return F(f)
 
225
    else:
 
226
        return pathjoin(F(p), e)
 
227
 
 
228
 
 
229
def backup_file(fn):
 
230
    """Copy a file to a backup.
 
231
 
 
232
    Backups are named in GNU-style, with a ~ suffix.
 
233
 
 
234
    If the file is already a backup, it's not copied.
 
235
    """
 
236
    if fn[-1] == '~':
 
237
        return
 
238
    bfn = fn + '~'
 
239
 
 
240
    if has_symlinks() and os.path.islink(fn):
 
241
        target = os.readlink(fn)
 
242
        os.symlink(target, bfn)
 
243
        return
 
244
    inf = file(fn, 'rb')
 
245
    try:
 
246
        content = inf.read()
 
247
    finally:
 
248
        inf.close()
 
249
    
 
250
    outf = file(bfn, 'wb')
 
251
    try:
 
252
        outf.write(content)
 
253
    finally:
 
254
        outf.close()
 
255
 
 
256
 
 
257
def isdir(f):
 
258
    """True if f is an accessible directory."""
 
259
    try:
 
260
        return S_ISDIR(os.lstat(f)[ST_MODE])
 
261
    except OSError:
 
262
        return False
 
263
 
 
264
 
 
265
def isfile(f):
 
266
    """True if f is a regular file."""
 
267
    try:
 
268
        return S_ISREG(os.lstat(f)[ST_MODE])
 
269
    except OSError:
 
270
        return False
 
271
 
 
272
def islink(f):
 
273
    """True if f is a symlink."""
 
274
    try:
 
275
        return S_ISLNK(os.lstat(f)[ST_MODE])
 
276
    except OSError:
 
277
        return False
 
278
 
 
279
def is_inside(dir, fname):
 
280
    """True if fname is inside dir.
 
281
    
 
282
    The parameters should typically be passed to osutils.normpath first, so
 
283
    that . and .. and repeated slashes are eliminated, and the separators
 
284
    are canonical for the platform.
 
285
    
 
286
    The empty string as a dir name is taken as top-of-tree and matches 
 
287
    everything.
 
288
    
 
289
    >>> is_inside('src', pathjoin('src', 'foo.c'))
 
290
    True
 
291
    >>> is_inside('src', 'srccontrol')
 
292
    False
 
293
    >>> is_inside('src', pathjoin('src', 'a', 'a', 'a', 'foo.c'))
 
294
    True
 
295
    >>> is_inside('foo.c', 'foo.c')
 
296
    True
 
297
    >>> is_inside('foo.c', '')
 
298
    False
 
299
    >>> is_inside('', 'foo.c')
 
300
    True
 
301
    """
 
302
    # XXX: Most callers of this can actually do something smarter by 
 
303
    # looking at the inventory
 
304
    if dir == fname:
 
305
        return True
 
306
    
 
307
    if dir == '':
 
308
        return True
 
309
 
 
310
    if dir[-1] != '/':
 
311
        dir += '/'
 
312
 
 
313
    return fname.startswith(dir)
 
314
 
 
315
 
 
316
def is_inside_any(dir_list, fname):
 
317
    """True if fname is inside any of given dirs."""
 
318
    for dirname in dir_list:
 
319
        if is_inside(dirname, fname):
 
320
            return True
 
321
    else:
 
322
        return False
 
323
 
 
324
 
 
325
def pumpfile(fromfile, tofile):
 
326
    """Copy contents of one file to another."""
 
327
    BUFSIZE = 32768
 
328
    while True:
 
329
        b = fromfile.read(BUFSIZE)
 
330
        if not b:
 
331
            break
 
332
        tofile.write(b)
 
333
 
 
334
 
 
335
def file_iterator(input_file, readsize=32768):
 
336
    while True:
 
337
        b = input_file.read(readsize)
 
338
        if len(b) == 0:
 
339
            break
 
340
        yield b
 
341
 
 
342
 
 
343
def sha_file(f):
 
344
    if hasattr(f, 'tell'):
 
345
        assert f.tell() == 0
 
346
    s = sha.new()
 
347
    BUFSIZE = 128<<10
 
348
    while True:
 
349
        b = f.read(BUFSIZE)
 
350
        if not b:
 
351
            break
 
352
        s.update(b)
 
353
    return s.hexdigest()
 
354
 
 
355
 
 
356
 
 
357
def sha_strings(strings):
 
358
    """Return the sha-1 of concatenation of strings"""
 
359
    s = sha.new()
 
360
    map(s.update, strings)
 
361
    return s.hexdigest()
 
362
 
 
363
 
 
364
def sha_string(f):
 
365
    s = sha.new()
 
366
    s.update(f)
 
367
    return s.hexdigest()
 
368
 
 
369
 
 
370
def fingerprint_file(f):
 
371
    s = sha.new()
 
372
    b = f.read()
 
373
    s.update(b)
 
374
    size = len(b)
 
375
    return {'size': size,
 
376
            'sha1': s.hexdigest()}
 
377
 
 
378
 
 
379
def compare_files(a, b):
 
380
    """Returns true if equal in contents"""
 
381
    BUFSIZE = 4096
 
382
    while True:
 
383
        ai = a.read(BUFSIZE)
 
384
        bi = b.read(BUFSIZE)
 
385
        if ai != bi:
 
386
            return False
 
387
        if ai == '':
 
388
            return True
 
389
 
 
390
 
 
391
def local_time_offset(t=None):
 
392
    """Return offset of local zone from GMT, either at present or at time t."""
 
393
    # python2.3 localtime() can't take None
 
394
    if t == None:
 
395
        t = time.time()
 
396
        
 
397
    if time.localtime(t).tm_isdst and time.daylight:
 
398
        return -time.altzone
 
399
    else:
 
400
        return -time.timezone
 
401
 
 
402
    
 
403
def format_date(t, offset=0, timezone='original', date_fmt=None, 
 
404
                show_offset=True):
 
405
    ## TODO: Perhaps a global option to use either universal or local time?
 
406
    ## Or perhaps just let people set $TZ?
 
407
    assert isinstance(t, float)
 
408
    
 
409
    if timezone == 'utc':
 
410
        tt = time.gmtime(t)
 
411
        offset = 0
 
412
    elif timezone == 'original':
 
413
        if offset == None:
 
414
            offset = 0
 
415
        tt = time.gmtime(t + offset)
 
416
    elif timezone == 'local':
 
417
        tt = time.localtime(t)
 
418
        offset = local_time_offset(t)
 
419
    else:
 
420
        raise BzrError("unsupported timezone format %r" % timezone,
 
421
                       ['options are "utc", "original", "local"'])
 
422
    if date_fmt is None:
 
423
        date_fmt = "%a %Y-%m-%d %H:%M:%S"
 
424
    if show_offset:
 
425
        offset_str = ' %+03d%02d' % (offset / 3600, (offset / 60) % 60)
 
426
    else:
 
427
        offset_str = ''
 
428
    return (time.strftime(date_fmt, tt) +  offset_str)
 
429
 
 
430
 
 
431
def compact_date(when):
 
432
    return time.strftime('%Y%m%d%H%M%S', time.gmtime(when))
 
433
    
 
434
 
 
435
 
 
436
def filesize(f):
 
437
    """Return size of given open file."""
 
438
    return os.fstat(f.fileno())[ST_SIZE]
 
439
 
 
440
# Define rand_bytes based on platform.
 
441
try:
 
442
    # Python 2.4 and later have os.urandom,
 
443
    # but it doesn't work on some arches
 
444
    os.urandom(1)
 
445
    rand_bytes = os.urandom
 
446
except (NotImplementedError, AttributeError):
 
447
    # If python doesn't have os.urandom, or it doesn't work,
 
448
    # then try to first pull random data from /dev/urandom
 
449
    if os.path.exists("/dev/urandom"):
 
450
        rand_bytes = file('/dev/urandom', 'rb').read
 
451
    # Otherwise, use this hack as a last resort
 
452
    else:
 
453
        # not well seeded, but better than nothing
 
454
        def rand_bytes(n):
 
455
            import random
 
456
            s = ''
 
457
            while n:
 
458
                s += chr(random.randint(0, 255))
 
459
                n -= 1
 
460
            return s
 
461
 
 
462
## TODO: We could later have path objects that remember their list
 
463
## decomposition (might be too tricksy though.)
 
464
 
 
465
def splitpath(p):
 
466
    """Turn string into list of parts.
 
467
 
 
468
    >>> splitpath('a')
 
469
    ['a']
 
470
    >>> splitpath('a/b')
 
471
    ['a', 'b']
 
472
    >>> splitpath('a/./b')
 
473
    ['a', 'b']
 
474
    >>> splitpath('a/.b')
 
475
    ['a', '.b']
 
476
    >>> splitpath('a/../b')
 
477
    Traceback (most recent call last):
 
478
    ...
 
479
    BzrError: sorry, '..' not allowed in path
 
480
    """
 
481
    assert isinstance(p, types.StringTypes)
 
482
 
 
483
    # split on either delimiter because people might use either on
 
484
    # Windows
 
485
    ps = re.split(r'[\\/]', p)
 
486
 
 
487
    rps = []
 
488
    for f in ps:
 
489
        if f == '..':
 
490
            raise BzrError("sorry, %r not allowed in path" % f)
 
491
        elif (f == '.') or (f == ''):
 
492
            pass
 
493
        else:
 
494
            rps.append(f)
 
495
    return rps
 
496
 
 
497
def joinpath(p):
 
498
    assert isinstance(p, list)
 
499
    for f in p:
 
500
        if (f == '..') or (f == None) or (f == ''):
 
501
            raise BzrError("sorry, %r not allowed in path" % f)
 
502
    return pathjoin(*p)
 
503
 
 
504
 
 
505
def appendpath(p1, p2):
 
506
    if p1 == '':
 
507
        return p2
 
508
    else:
 
509
        return pathjoin(p1, p2)
 
510
    
 
511
 
 
512
def split_lines(s):
 
513
    """Split s into lines, but without removing the newline characters."""
 
514
    return StringIO(s).readlines()
 
515
 
 
516
 
 
517
def hardlinks_good():
 
518
    return sys.platform not in ('win32', 'cygwin', 'darwin')
 
519
 
 
520
 
 
521
def link_or_copy(src, dest):
 
522
    """Hardlink a file, or copy it if it can't be hardlinked."""
 
523
    if not hardlinks_good():
 
524
        copyfile(src, dest)
 
525
        return
 
526
    try:
 
527
        os.link(src, dest)
 
528
    except (OSError, IOError), e:
 
529
        if e.errno != errno.EXDEV:
 
530
            raise
 
531
        copyfile(src, dest)
 
532
 
 
533
 
 
534
def has_symlinks():
 
535
    if hasattr(os, 'symlink'):
 
536
        return True
 
537
    else:
 
538
        return False
 
539
        
 
540
 
 
541
def contains_whitespace(s):
 
542
    """True if there are any whitespace characters in s."""
 
543
    for ch in string.whitespace:
 
544
        if ch in s:
 
545
            return True
 
546
    else:
 
547
        return False
 
548
 
 
549
 
 
550
def contains_linebreaks(s):
 
551
    """True if there is any vertical whitespace in s."""
 
552
    for ch in '\f\n\r':
 
553
        if ch in s:
 
554
            return True
 
555
    else:
 
556
        return False
 
557
 
 
558
 
 
559
def relpath(base, path):
 
560
    """Return path relative to base, or raise exception.
 
561
 
 
562
    The path may be either an absolute path or a path relative to the
 
563
    current working directory.
 
564
 
 
565
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
566
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
567
    avoids that problem."""
 
568
    rp = abspath(path)
 
569
 
 
570
    s = []
 
571
    head = rp
 
572
    while len(head) >= len(base):
 
573
        if head == base:
 
574
            break
 
575
        head, tail = os.path.split(head)
 
576
        if tail:
 
577
            s.insert(0, tail)
 
578
    else:
 
579
        # XXX This should raise a NotChildPath exception, as its not tied
 
580
        # to branch anymore.
 
581
        raise PathNotChild(rp, base)
 
582
 
 
583
    if s:
 
584
        return pathjoin(*s)
 
585
    else:
 
586
        return ''
 
587
 
 
588
 
 
589
def terminal_width():
 
590
    """Return estimated terminal width."""
 
591
 
 
592
    # TODO: Do something smart on Windows?
 
593
 
 
594
    # TODO: Is there anything that gets a better update when the window
 
595
    # is resized while the program is running? We could use the Python termcap
 
596
    # library.
 
597
    try:
 
598
        return int(os.environ['COLUMNS'])
 
599
    except (IndexError, KeyError, ValueError):
 
600
        return 80