/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: John Arbash Meinel
  • Date: 2006-07-03 18:27:35 UTC
  • mto: This revision was merged to the branch mainline in revision 1851.
  • Revision ID: john@arbash-meinel.com-20060703182735-3081f13e92d7f657
WorkingTree.open_containing() was directly calling os.getcwdu(), which on mac returns the wrong normalization, and on win32 would have the wrong slashes

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
# Bazaar-NG -- distributed version control
2
 
 
 
2
#
3
3
# Copyright (C) 2005 by Canonical Ltd
4
 
 
 
4
#
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
 
 
9
#
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
 
 
14
#
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
import os, types, re, time, errno, sys
20
 
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
 
19
from cStringIO import StringIO
 
20
import errno
 
21
from ntpath import (abspath as _nt_abspath,
 
22
                    join as _nt_join,
 
23
                    normpath as _nt_normpath,
 
24
                    realpath as _nt_realpath,
 
25
                    splitdrive as _nt_splitdrive,
 
26
                    )
 
27
import os
 
28
from os import listdir
 
29
import posixpath
 
30
import re
 
31
import sha
 
32
import shutil
 
33
from shutil import copyfile
 
34
import stat
 
35
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
 
36
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
 
37
import string
 
38
import sys
 
39
import time
 
40
import types
 
41
import tempfile
 
42
import unicodedata
21
43
 
22
 
from bzrlib.errors import BzrError
 
44
import bzrlib
 
45
from bzrlib.errors import (BzrError,
 
46
                           BzrBadParameterNotUnicode,
 
47
                           NoSuchFile,
 
48
                           PathNotChild,
 
49
                           IllegalPath,
 
50
                           )
 
51
from bzrlib.symbol_versioning import (deprecated_function, 
 
52
        zero_nine)
23
53
from bzrlib.trace import mutter
24
 
import bzrlib
 
54
 
25
55
 
26
56
def make_readonly(filename):
27
57
    """Make a filename read-only."""
28
 
    # TODO: probably needs to be fixed for windows
29
58
    mod = os.stat(filename).st_mode
30
59
    mod = mod & 0777555
31
60
    os.chmod(filename, mod)
37
66
    os.chmod(filename, mod)
38
67
 
39
68
 
40
 
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
 
69
_QUOTE_RE = None
41
70
 
42
 
_SLASH_RE = re.compile(r'[\\/]+')
43
71
 
44
72
def quotefn(f):
45
73
    """Return a quoted filename filename
47
75
    This previously used backslash quoting, but that works poorly on
48
76
    Windows."""
49
77
    # TODO: I'm not really sure this is the best format either.x
 
78
    global _QUOTE_RE
 
79
    if _QUOTE_RE == None:
 
80
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
 
81
        
50
82
    if _QUOTE_RE.search(f):
51
83
        return '"' + f + '"'
52
84
    else:
53
85
        return f
54
86
 
55
87
 
56
 
def file_kind(f):
57
 
    mode = os.lstat(f)[ST_MODE]
58
 
    if S_ISREG(mode):
59
 
        return 'file'
60
 
    elif S_ISDIR(mode):
61
 
        return 'directory'
62
 
    elif S_ISLNK(mode):
63
 
        return 'symlink'
64
 
    else:
65
 
        raise BzrError("can't handle file kind with mode %o of %r" % (mode, f))
 
88
_directory_kind = 'directory'
 
89
 
 
90
_formats = {
 
91
    stat.S_IFDIR:_directory_kind,
 
92
    stat.S_IFCHR:'chardev',
 
93
    stat.S_IFBLK:'block',
 
94
    stat.S_IFREG:'file',
 
95
    stat.S_IFIFO:'fifo',
 
96
    stat.S_IFLNK:'symlink',
 
97
    stat.S_IFSOCK:'socket',
 
98
}
 
99
 
 
100
 
 
101
def file_kind_from_stat_mode(stat_mode, _formats=_formats, _unknown='unknown'):
 
102
    """Generate a file kind from a stat mode. This is used in walkdirs.
 
103
 
 
104
    Its performance is critical: Do not mutate without careful benchmarking.
 
105
    """
 
106
    try:
 
107
        return _formats[stat_mode & 0170000]
 
108
    except KeyError:
 
109
        return _unknown
 
110
 
 
111
 
 
112
def file_kind(f, _lstat=os.lstat, _mapper=file_kind_from_stat_mode):
 
113
    try:
 
114
        return _mapper(_lstat(f).st_mode)
 
115
    except OSError, e:
 
116
        if getattr(e, 'errno', None) == errno.ENOENT:
 
117
            raise bzrlib.errors.NoSuchFile(f)
 
118
        raise
66
119
 
67
120
 
68
121
def kind_marker(kind):
69
122
    if kind == 'file':
70
123
        return ''
71
 
    elif kind == 'directory':
 
124
    elif kind == _directory_kind:
72
125
        return '/'
73
126
    elif kind == 'symlink':
74
127
        return '@'
75
128
    else:
76
129
        raise BzrError('invalid file kind %r' % kind)
77
130
 
 
131
lexists = getattr(os.path, 'lexists', None)
 
132
if lexists is None:
 
133
    def lexists(f):
 
134
        try:
 
135
            if hasattr(os, 'lstat'):
 
136
                os.lstat(f)
 
137
            else:
 
138
                os.stat(f)
 
139
            return True
 
140
        except OSError,e:
 
141
            if e.errno == errno.ENOENT:
 
142
                return False;
 
143
            else:
 
144
                raise BzrError("lstat/stat of (%r): %r" % (f, e))
 
145
 
 
146
 
 
147
def fancy_rename(old, new, rename_func, unlink_func):
 
148
    """A fancy rename, when you don't have atomic rename.
 
149
    
 
150
    :param old: The old path, to rename from
 
151
    :param new: The new path, to rename to
 
152
    :param rename_func: The potentially non-atomic rename function
 
153
    :param unlink_func: A way to delete the target file if the full rename succeeds
 
154
    """
 
155
 
 
156
    # sftp rename doesn't allow overwriting, so play tricks:
 
157
    import random
 
158
    base = os.path.basename(new)
 
159
    dirname = os.path.dirname(new)
 
160
    tmp_name = u'tmp.%s.%.9f.%d.%s' % (base, time.time(), os.getpid(), rand_chars(10))
 
161
    tmp_name = pathjoin(dirname, tmp_name)
 
162
 
 
163
    # Rename the file out of the way, but keep track if it didn't exist
 
164
    # We don't want to grab just any exception
 
165
    # something like EACCES should prevent us from continuing
 
166
    # The downside is that the rename_func has to throw an exception
 
167
    # with an errno = ENOENT, or NoSuchFile
 
168
    file_existed = False
 
169
    try:
 
170
        rename_func(new, tmp_name)
 
171
    except (NoSuchFile,), e:
 
172
        pass
 
173
    except IOError, e:
 
174
        # RBC 20060103 abstraction leakage: the paramiko SFTP clients rename
 
175
        # function raises an IOError with errno == None when a rename fails.
 
176
        # This then gets caught here.
 
177
        if e.errno not in (None, errno.ENOENT, errno.ENOTDIR):
 
178
            raise
 
179
    except Exception, e:
 
180
        if (not hasattr(e, 'errno') 
 
181
            or e.errno not in (errno.ENOENT, errno.ENOTDIR)):
 
182
            raise
 
183
    else:
 
184
        file_existed = True
 
185
 
 
186
    success = False
 
187
    try:
 
188
        # This may throw an exception, in which case success will
 
189
        # not be set.
 
190
        rename_func(old, new)
 
191
        success = True
 
192
    finally:
 
193
        if file_existed:
 
194
            # If the file used to exist, rename it back into place
 
195
            # otherwise just delete it from the tmp location
 
196
            if success:
 
197
                unlink_func(tmp_name)
 
198
            else:
 
199
                rename_func(tmp_name, new)
 
200
 
 
201
 
 
202
# In Python 2.4.2 and older, os.path.abspath and os.path.realpath
 
203
# choke on a Unicode string containing a relative path if
 
204
# os.getcwd() returns a non-sys.getdefaultencoding()-encoded
 
205
# string.
 
206
_fs_enc = sys.getfilesystemencoding()
 
207
def _posix_abspath(path):
 
208
    # jam 20060426 rather than encoding to fsencoding
 
209
    # copy posixpath.abspath, but use os.getcwdu instead
 
210
    if not posixpath.isabs(path):
 
211
        path = posixpath.join(getcwd(), path)
 
212
    return posixpath.normpath(path)
 
213
 
 
214
 
 
215
def _posix_realpath(path):
 
216
    return posixpath.realpath(path.encode(_fs_enc)).decode(_fs_enc)
 
217
 
 
218
 
 
219
def _win32_fixdrive(path):
 
220
    """Force drive letters to be consistent.
 
221
 
 
222
    win32 is inconsistent whether it returns lower or upper case
 
223
    and even if it was consistent the user might type the other
 
224
    so we force it to uppercase
 
225
    running python.exe under cmd.exe return capital C:\\
 
226
    running win32 python inside a cygwin shell returns lowercase c:\\
 
227
    """
 
228
    drive, path = _nt_splitdrive(path)
 
229
    return drive.upper() + path
 
230
 
 
231
 
 
232
def _win32_abspath(path):
 
233
    # Real _nt_abspath doesn't have a problem with a unicode cwd
 
234
    return _win32_fixdrive(_nt_abspath(unicode(path)).replace('\\', '/'))
 
235
 
 
236
 
 
237
def _win32_realpath(path):
 
238
    # Real _nt_realpath doesn't have a problem with a unicode cwd
 
239
    return _win32_fixdrive(_nt_realpath(unicode(path)).replace('\\', '/'))
 
240
 
 
241
 
 
242
def _win32_pathjoin(*args):
 
243
    return _nt_join(*args).replace('\\', '/')
 
244
 
 
245
 
 
246
def _win32_normpath(path):
 
247
    return _win32_fixdrive(_nt_normpath(unicode(path)).replace('\\', '/'))
 
248
 
 
249
 
 
250
def _win32_getcwd():
 
251
    return _win32_fixdrive(os.getcwdu().replace('\\', '/'))
 
252
 
 
253
 
 
254
def _win32_mkdtemp(*args, **kwargs):
 
255
    return _win32_fixdrive(tempfile.mkdtemp(*args, **kwargs).replace('\\', '/'))
 
256
 
 
257
 
 
258
def _win32_rename(old, new):
 
259
    """We expect to be able to atomically replace 'new' with old.
 
260
 
 
261
    On win32, if new exists, it must be moved out of the way first,
 
262
    and then deleted. 
 
263
    """
 
264
    try:
 
265
        fancy_rename(old, new, rename_func=os.rename, unlink_func=os.unlink)
 
266
    except OSError, e:
 
267
        if e.errno in (errno.EPERM, errno.EACCES, errno.EBUSY):
 
268
            # If we try to rename a non-existant file onto cwd, we get EPERM
 
269
            # instead of ENOENT, this will raise ENOENT if the old path
 
270
            # doesn't exist
 
271
            os.lstat(old)
 
272
        raise
 
273
 
 
274
 
 
275
def _mac_getcwd():
 
276
    return unicodedata.normalize('NFKC', os.getcwdu())
 
277
 
 
278
 
 
279
# Default is to just use the python builtins, but these can be rebound on
 
280
# particular platforms.
 
281
abspath = _posix_abspath
 
282
realpath = _posix_realpath
 
283
pathjoin = os.path.join
 
284
normpath = os.path.normpath
 
285
getcwd = os.getcwdu
 
286
mkdtemp = tempfile.mkdtemp
 
287
rename = os.rename
 
288
dirname = os.path.dirname
 
289
basename = os.path.basename
 
290
rmtree = shutil.rmtree
 
291
 
 
292
MIN_ABS_PATHLENGTH = 1
 
293
 
 
294
 
 
295
if sys.platform == 'win32':
 
296
    abspath = _win32_abspath
 
297
    realpath = _win32_realpath
 
298
    pathjoin = _win32_pathjoin
 
299
    normpath = _win32_normpath
 
300
    getcwd = _win32_getcwd
 
301
    mkdtemp = _win32_mkdtemp
 
302
    rename = _win32_rename
 
303
 
 
304
    MIN_ABS_PATHLENGTH = 3
 
305
 
 
306
    def _win32_delete_readonly(function, path, excinfo):
 
307
        """Error handler for shutil.rmtree function [for win32]
 
308
        Helps to remove files and dirs marked as read-only.
 
309
        """
 
310
        type_, value = excinfo[:2]
 
311
        if function in (os.remove, os.rmdir) \
 
312
            and type_ == OSError \
 
313
            and value.errno == errno.EACCES:
 
314
            bzrlib.osutils.make_writable(path)
 
315
            function(path)
 
316
        else:
 
317
            raise
 
318
 
 
319
    def rmtree(path, ignore_errors=False, onerror=_win32_delete_readonly):
 
320
        """Replacer for shutil.rmtree: could remove readonly dirs/files"""
 
321
        return shutil.rmtree(path, ignore_errors, onerror)
 
322
elif sys.platform == 'darwin':
 
323
    getcwd = _mac_getcwd
 
324
 
 
325
 
 
326
def get_terminal_encoding():
 
327
    """Find the best encoding for printing to the screen.
 
328
 
 
329
    This attempts to check both sys.stdout and sys.stdin to see
 
330
    what encoding they are in, and if that fails it falls back to
 
331
    bzrlib.user_encoding.
 
332
    The problem is that on Windows, locale.getpreferredencoding()
 
333
    is not the same encoding as that used by the console:
 
334
    http://mail.python.org/pipermail/python-list/2003-May/162357.html
 
335
 
 
336
    On my standard US Windows XP, the preferred encoding is
 
337
    cp1252, but the console is cp437
 
338
    """
 
339
    output_encoding = getattr(sys.stdout, 'encoding', None)
 
340
    if not output_encoding:
 
341
        input_encoding = getattr(sys.stdin, 'encoding', None)
 
342
        if not input_encoding:
 
343
            output_encoding = bzrlib.user_encoding
 
344
            mutter('encoding stdout as bzrlib.user_encoding %r', output_encoding)
 
345
        else:
 
346
            output_encoding = input_encoding
 
347
            mutter('encoding stdout as sys.stdin encoding %r', output_encoding)
 
348
    else:
 
349
        mutter('encoding stdout as sys.stdout encoding %r', output_encoding)
 
350
    return output_encoding
 
351
 
 
352
 
 
353
def normalizepath(f):
 
354
    if hasattr(os.path, 'realpath'):
 
355
        F = realpath
 
356
    else:
 
357
        F = abspath
 
358
    [p,e] = os.path.split(f)
 
359
    if e == "" or e == "." or e == "..":
 
360
        return F(f)
 
361
    else:
 
362
        return pathjoin(F(p), e)
78
363
 
79
364
 
80
365
def backup_file(fn):
84
369
 
85
370
    If the file is already a backup, it's not copied.
86
371
    """
87
 
    import os
88
372
    if fn[-1] == '~':
89
373
        return
90
374
    bfn = fn + '~'
91
375
 
 
376
    if has_symlinks() and os.path.islink(fn):
 
377
        target = os.readlink(fn)
 
378
        os.symlink(target, bfn)
 
379
        return
92
380
    inf = file(fn, 'rb')
93
381
    try:
94
382
        content = inf.read()
101
389
    finally:
102
390
        outf.close()
103
391
 
104
 
def rename(path_from, path_to):
105
 
    """Basically the same as os.rename() just special for win32"""
106
 
    if sys.platform == 'win32':
107
 
        try:
108
 
            os.remove(path_to)
109
 
        except OSError, e:
110
 
            if e.errno != e.ENOENT:
111
 
                raise
112
 
    os.rename(path_from, path_to)
113
 
 
114
 
 
115
 
 
116
 
 
117
392
 
118
393
def isdir(f):
119
394
    """True if f is an accessible directory."""
123
398
        return False
124
399
 
125
400
 
126
 
 
127
401
def isfile(f):
128
402
    """True if f is a regular file."""
129
403
    try:
131
405
    except OSError:
132
406
        return False
133
407
 
 
408
def islink(f):
 
409
    """True if f is a symlink."""
 
410
    try:
 
411
        return S_ISLNK(os.lstat(f)[ST_MODE])
 
412
    except OSError:
 
413
        return False
134
414
 
135
415
def is_inside(dir, fname):
136
416
    """True if fname is inside dir.
137
417
    
138
 
    The parameters should typically be passed to os.path.normpath first, so
 
418
    The parameters should typically be passed to osutils.normpath first, so
139
419
    that . and .. and repeated slashes are eliminated, and the separators
140
420
    are canonical for the platform.
141
421
    
142
422
    The empty string as a dir name is taken as top-of-tree and matches 
143
423
    everything.
144
424
    
145
 
    >>> is_inside('src', 'src/foo.c')
 
425
    >>> is_inside('src', pathjoin('src', 'foo.c'))
146
426
    True
147
427
    >>> is_inside('src', 'srccontrol')
148
428
    False
149
 
    >>> is_inside('src', 'src/a/a/a/foo.c')
 
429
    >>> is_inside('src', pathjoin('src', 'a', 'a', 'a', 'foo.c'))
150
430
    True
151
431
    >>> is_inside('foo.c', 'foo.c')
152
432
    True
162
442
    
163
443
    if dir == '':
164
444
        return True
165
 
    
166
 
    if dir[-1] != os.sep:
167
 
        dir += os.sep
168
 
    
 
445
 
 
446
    if dir[-1] != '/':
 
447
        dir += '/'
 
448
 
169
449
    return fname.startswith(dir)
170
450
 
171
451
 
178
458
        return False
179
459
 
180
460
 
 
461
def is_inside_or_parent_of_any(dir_list, fname):
 
462
    """True if fname is a child or a parent of any of the given files."""
 
463
    for dirname in dir_list:
 
464
        if is_inside(dirname, fname) or is_inside(fname, dirname):
 
465
            return True
 
466
    else:
 
467
        return False
 
468
 
 
469
 
181
470
def pumpfile(fromfile, tofile):
182
471
    """Copy contents of one file to another."""
183
 
    tofile.write(fromfile.read())
184
 
 
185
 
 
186
 
def uuid():
187
 
    """Return a new UUID"""
188
 
    try:
189
 
        return file('/proc/sys/kernel/random/uuid').readline().rstrip('\n')
190
 
    except IOError:
191
 
        return chomp(os.popen('uuidgen').readline())
 
472
    BUFSIZE = 32768
 
473
    while True:
 
474
        b = fromfile.read(BUFSIZE)
 
475
        if not b:
 
476
            break
 
477
        tofile.write(b)
 
478
 
 
479
 
 
480
def file_iterator(input_file, readsize=32768):
 
481
    while True:
 
482
        b = input_file.read(readsize)
 
483
        if len(b) == 0:
 
484
            break
 
485
        yield b
192
486
 
193
487
 
194
488
def sha_file(f):
195
 
    import sha
196
489
    if hasattr(f, 'tell'):
197
490
        assert f.tell() == 0
198
491
    s = sha.new()
205
498
    return s.hexdigest()
206
499
 
207
500
 
 
501
 
 
502
def sha_strings(strings):
 
503
    """Return the sha-1 of concatenation of strings"""
 
504
    s = sha.new()
 
505
    map(s.update, strings)
 
506
    return s.hexdigest()
 
507
 
 
508
 
208
509
def sha_string(f):
209
 
    import sha
210
510
    s = sha.new()
211
511
    s.update(f)
212
512
    return s.hexdigest()
213
513
 
214
514
 
215
 
 
216
515
def fingerprint_file(f):
217
 
    import sha
218
516
    s = sha.new()
219
517
    b = f.read()
220
518
    s.update(b)
223
521
            'sha1': s.hexdigest()}
224
522
 
225
523
 
226
 
def config_dir():
227
 
    """Return per-user configuration directory.
228
 
 
229
 
    By default this is ~/.bzr.conf/
230
 
    
231
 
    TODO: Global option --config-dir to override this.
232
 
    """
233
 
    return os.path.expanduser("~/.bzr.conf")
234
 
 
235
 
 
236
 
def _auto_user_id():
237
 
    """Calculate automatic user identification.
238
 
 
239
 
    Returns (realname, email).
240
 
 
241
 
    Only used when none is set in the environment or the id file.
242
 
 
243
 
    This previously used the FQDN as the default domain, but that can
244
 
    be very slow on machines where DNS is broken.  So now we simply
245
 
    use the hostname.
246
 
    """
247
 
    import socket
248
 
 
249
 
    # XXX: Any good way to get real user name on win32?
250
 
 
251
 
    try:
252
 
        import pwd
253
 
        uid = os.getuid()
254
 
        w = pwd.getpwuid(uid)
255
 
        gecos = w.pw_gecos.decode(bzrlib.user_encoding)
256
 
        username = w.pw_name.decode(bzrlib.user_encoding)
257
 
        comma = gecos.find(',')
258
 
        if comma == -1:
259
 
            realname = gecos
260
 
        else:
261
 
            realname = gecos[:comma]
262
 
        if not realname:
263
 
            realname = username
264
 
 
265
 
    except ImportError:
266
 
        import getpass
267
 
        realname = username = getpass.getuser().decode(bzrlib.user_encoding)
268
 
 
269
 
    return realname, (username + '@' + socket.gethostname())
270
 
 
271
 
 
272
 
def _get_user_id():
273
 
    """Return the full user id from a file or environment variable.
274
 
 
275
 
    TODO: Allow taking this from a file in the branch directory too
276
 
    for per-branch ids."""
277
 
    v = os.environ.get('BZREMAIL')
278
 
    if v:
279
 
        return v.decode(bzrlib.user_encoding)
280
 
    
281
 
    try:
282
 
        return (open(os.path.join(config_dir(), "email"))
283
 
                .read()
284
 
                .decode(bzrlib.user_encoding)
285
 
                .rstrip("\r\n"))
286
 
    except IOError, e:
287
 
        if e.errno != errno.ENOENT:
288
 
            raise e
289
 
 
290
 
    v = os.environ.get('EMAIL')
291
 
    if v:
292
 
        return v.decode(bzrlib.user_encoding)
293
 
    else:    
294
 
        return None
295
 
 
296
 
 
297
 
def username():
298
 
    """Return email-style username.
299
 
 
300
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
301
 
 
302
 
    TODO: Check it's reasonably well-formed.
303
 
    """
304
 
    v = _get_user_id()
305
 
    if v:
306
 
        return v
307
 
    
308
 
    name, email = _auto_user_id()
309
 
    if name:
310
 
        return '%s <%s>' % (name, email)
311
 
    else:
312
 
        return email
313
 
 
314
 
 
315
 
_EMAIL_RE = re.compile(r'[\w+.-]+@[\w+.-]+')
316
 
def user_email():
317
 
    """Return just the email component of a username."""
318
 
    e = _get_user_id()
319
 
    if e:
320
 
        m = _EMAIL_RE.search(e)
321
 
        if not m:
322
 
            raise BzrError("%r doesn't seem to contain a reasonable email address" % e)
323
 
        return m.group(0)
324
 
 
325
 
    return _auto_user_id()[1]
326
 
    
327
 
 
328
 
 
329
524
def compare_files(a, b):
330
525
    """Returns true if equal in contents"""
331
526
    BUFSIZE = 4096
338
533
            return True
339
534
 
340
535
 
341
 
 
342
536
def local_time_offset(t=None):
343
537
    """Return offset of local zone from GMT, either at present or at time t."""
344
538
    # python2.3 localtime() can't take None
351
545
        return -time.timezone
352
546
 
353
547
    
354
 
def format_date(t, offset=0, timezone='original'):
 
548
def format_date(t, offset=0, timezone='original', date_fmt=None, 
 
549
                show_offset=True):
355
550
    ## TODO: Perhaps a global option to use either universal or local time?
356
551
    ## Or perhaps just let people set $TZ?
357
552
    assert isinstance(t, float)
369
564
    else:
370
565
        raise BzrError("unsupported timezone format %r" % timezone,
371
566
                       ['options are "utc", "original", "local"'])
372
 
 
373
 
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
374
 
            + ' %+03d%02d' % (offset / 3600, (offset / 60) % 60))
 
567
    if date_fmt is None:
 
568
        date_fmt = "%a %Y-%m-%d %H:%M:%S"
 
569
    if show_offset:
 
570
        offset_str = ' %+03d%02d' % (offset / 3600, (offset / 60) % 60)
 
571
    else:
 
572
        offset_str = ''
 
573
    return (time.strftime(date_fmt, tt) +  offset_str)
375
574
 
376
575
 
377
576
def compact_date(when):
384
583
    return os.fstat(f.fileno())[ST_SIZE]
385
584
 
386
585
 
387
 
if hasattr(os, 'urandom'): # python 2.4 and later
 
586
# Define rand_bytes based on platform.
 
587
try:
 
588
    # Python 2.4 and later have os.urandom,
 
589
    # but it doesn't work on some arches
 
590
    os.urandom(1)
388
591
    rand_bytes = os.urandom
389
 
elif sys.platform == 'linux2':
390
 
    rand_bytes = file('/dev/urandom', 'rb').read
391
 
else:
392
 
    # not well seeded, but better than nothing
393
 
    def rand_bytes(n):
394
 
        import random
395
 
        s = ''
396
 
        while n:
397
 
            s += chr(random.randint(0, 255))
398
 
            n -= 1
399
 
        return s
 
592
except (NotImplementedError, AttributeError):
 
593
    # If python doesn't have os.urandom, or it doesn't work,
 
594
    # then try to first pull random data from /dev/urandom
 
595
    if os.path.exists("/dev/urandom"):
 
596
        rand_bytes = file('/dev/urandom', 'rb').read
 
597
    # Otherwise, use this hack as a last resort
 
598
    else:
 
599
        # not well seeded, but better than nothing
 
600
        def rand_bytes(n):
 
601
            import random
 
602
            s = ''
 
603
            while n:
 
604
                s += chr(random.randint(0, 255))
 
605
                n -= 1
 
606
            return s
 
607
 
 
608
 
 
609
ALNUM = '0123456789abcdefghijklmnopqrstuvwxyz'
 
610
def rand_chars(num):
 
611
    """Return a random string of num alphanumeric characters
 
612
    
 
613
    The result only contains lowercase chars because it may be used on 
 
614
    case-insensitive filesystems.
 
615
    """
 
616
    s = ''
 
617
    for raw_byte in rand_bytes(num):
 
618
        s += ALNUM[ord(raw_byte) % 36]
 
619
    return s
400
620
 
401
621
 
402
622
## TODO: We could later have path objects that remember their list
439
659
    for f in p:
440
660
        if (f == '..') or (f == None) or (f == ''):
441
661
            raise BzrError("sorry, %r not allowed in path" % f)
442
 
    return os.path.join(*p)
443
 
 
444
 
 
 
662
    return pathjoin(*p)
 
663
 
 
664
 
 
665
@deprecated_function(zero_nine)
445
666
def appendpath(p1, p2):
446
667
    if p1 == '':
447
668
        return p2
448
669
    else:
449
 
        return os.path.join(p1, p2)
 
670
        return pathjoin(p1, p2)
450
671
    
451
672
 
452
 
def extern_command(cmd, ignore_errors = False):
453
 
    mutter('external command: %s' % `cmd`)
454
 
    if os.system(cmd):
455
 
        if not ignore_errors:
456
 
            raise BzrError('command failed')
457
 
 
458
 
 
459
 
def _read_config_value(name):
460
 
    """Read a config value from the file ~/.bzr.conf/<name>
461
 
    Return None if the file does not exist"""
462
 
    try:
463
 
        f = file(os.path.join(config_dir(), name), "r")
464
 
        return f.read().decode(bzrlib.user_encoding).rstrip("\r\n")
465
 
    except IOError, e:
466
 
        if e.errno == errno.ENOENT:
467
 
            return None
468
 
        raise
469
 
 
470
 
 
471
 
def _get_editor():
472
 
    """Return a sequence of possible editor binaries for the current platform"""
473
 
    e = _read_config_value("editor")
474
 
    if e is not None:
475
 
        yield e
 
673
def split_lines(s):
 
674
    """Split s into lines, but without removing the newline characters."""
 
675
    lines = s.split('\n')
 
676
    result = [line + '\n' for line in lines[:-1]]
 
677
    if lines[-1]:
 
678
        result.append(lines[-1])
 
679
    return result
 
680
 
 
681
 
 
682
def hardlinks_good():
 
683
    return sys.platform not in ('win32', 'cygwin', 'darwin')
 
684
 
 
685
 
 
686
def link_or_copy(src, dest):
 
687
    """Hardlink a file, or copy it if it can't be hardlinked."""
 
688
    if not hardlinks_good():
 
689
        copyfile(src, dest)
 
690
        return
 
691
    try:
 
692
        os.link(src, dest)
 
693
    except (OSError, IOError), e:
 
694
        if e.errno != errno.EXDEV:
 
695
            raise
 
696
        copyfile(src, dest)
 
697
 
 
698
def delete_any(full_path):
 
699
    """Delete a file or directory."""
 
700
    try:
 
701
        os.unlink(full_path)
 
702
    except OSError, e:
 
703
    # We may be renaming a dangling inventory id
 
704
        if e.errno not in (errno.EISDIR, errno.EACCES, errno.EPERM):
 
705
            raise
 
706
        os.rmdir(full_path)
 
707
 
 
708
 
 
709
def has_symlinks():
 
710
    if hasattr(os, 'symlink'):
 
711
        return True
 
712
    else:
 
713
        return False
476
714
        
477
 
    if os.name == "windows":
478
 
        yield "notepad.exe"
479
 
    elif os.name == "posix":
 
715
 
 
716
def contains_whitespace(s):
 
717
    """True if there are any whitespace characters in s."""
 
718
    for ch in string.whitespace:
 
719
        if ch in s:
 
720
            return True
 
721
    else:
 
722
        return False
 
723
 
 
724
 
 
725
def contains_linebreaks(s):
 
726
    """True if there is any vertical whitespace in s."""
 
727
    for ch in '\f\n\r':
 
728
        if ch in s:
 
729
            return True
 
730
    else:
 
731
        return False
 
732
 
 
733
 
 
734
def relpath(base, path):
 
735
    """Return path relative to base, or raise exception.
 
736
 
 
737
    The path may be either an absolute path or a path relative to the
 
738
    current working directory.
 
739
 
 
740
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
741
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
742
    avoids that problem.
 
743
    """
 
744
 
 
745
    assert len(base) >= MIN_ABS_PATHLENGTH, ('Length of base must be equal or'
 
746
        ' exceed the platform minimum length (which is %d)' % 
 
747
        MIN_ABS_PATHLENGTH)
 
748
 
 
749
    rp = abspath(path)
 
750
 
 
751
    s = []
 
752
    head = rp
 
753
    while len(head) >= len(base):
 
754
        if head == base:
 
755
            break
 
756
        head, tail = os.path.split(head)
 
757
        if tail:
 
758
            s.insert(0, tail)
 
759
    else:
 
760
        raise PathNotChild(rp, base)
 
761
 
 
762
    if s:
 
763
        return pathjoin(*s)
 
764
    else:
 
765
        return ''
 
766
 
 
767
 
 
768
def safe_unicode(unicode_or_utf8_string):
 
769
    """Coerce unicode_or_utf8_string into unicode.
 
770
 
 
771
    If it is unicode, it is returned.
 
772
    Otherwise it is decoded from utf-8. If a decoding error
 
773
    occurs, it is wrapped as a If the decoding fails, the exception is wrapped 
 
774
    as a BzrBadParameter exception.
 
775
    """
 
776
    if isinstance(unicode_or_utf8_string, unicode):
 
777
        return unicode_or_utf8_string
 
778
    try:
 
779
        return unicode_or_utf8_string.decode('utf8')
 
780
    except UnicodeDecodeError:
 
781
        raise BzrBadParameterNotUnicode(unicode_or_utf8_string)
 
782
 
 
783
 
 
784
_platform_normalizes_filenames = False
 
785
if sys.platform == 'darwin':
 
786
    _platform_normalizes_filenames = True
 
787
 
 
788
 
 
789
def normalizes_filenames():
 
790
    """Return True if this platform normalizes unicode filenames.
 
791
 
 
792
    Mac OSX does, Windows/Linux do not.
 
793
    """
 
794
    return _platform_normalizes_filenames
 
795
 
 
796
 
 
797
def _accessible_normalized_filename(path):
 
798
    """Get the unicode normalized path, and if you can access the file.
 
799
 
 
800
    On platforms where the system normalizes filenames (Mac OSX),
 
801
    you can access a file by any path which will normalize correctly.
 
802
    On platforms where the system does not normalize filenames 
 
803
    (Windows, Linux), you have to access a file by its exact path.
 
804
 
 
805
    Internally, bzr only supports NFC/NFKC normalization, since that is 
 
806
    the standard for XML documents.
 
807
 
 
808
    So return the normalized path, and a flag indicating if the file
 
809
    can be accessed by that path.
 
810
    """
 
811
 
 
812
    return unicodedata.normalize('NFKC', unicode(path)), True
 
813
 
 
814
 
 
815
def _inaccessible_normalized_filename(path):
 
816
    __doc__ = _accessible_normalized_filename.__doc__
 
817
 
 
818
    normalized = unicodedata.normalize('NFKC', unicode(path))
 
819
    return normalized, normalized == path
 
820
 
 
821
 
 
822
if _platform_normalizes_filenames:
 
823
    normalized_filename = _accessible_normalized_filename
 
824
else:
 
825
    normalized_filename = _inaccessible_normalized_filename
 
826
 
 
827
 
 
828
def terminal_width():
 
829
    """Return estimated terminal width."""
 
830
    if sys.platform == 'win32':
 
831
        import bzrlib.win32console
 
832
        return bzrlib.win32console.get_console_size()[0]
 
833
    width = 0
 
834
    try:
 
835
        import struct, fcntl, termios
 
836
        s = struct.pack('HHHH', 0, 0, 0, 0)
 
837
        x = fcntl.ioctl(1, termios.TIOCGWINSZ, s)
 
838
        width = struct.unpack('HHHH', x)[1]
 
839
    except IOError:
 
840
        pass
 
841
    if width <= 0:
480
842
        try:
481
 
            yield os.environ["EDITOR"]
482
 
        except KeyError:
483
 
            yield "/usr/bin/vi"
484
 
 
485
 
 
486
 
def _run_editor(filename):
487
 
    """Try to execute an editor to edit the commit message. Returns True on success,
488
 
    False on failure"""
489
 
    for e in _get_editor():
490
 
        x = os.spawnvp(os.P_WAIT, e, (e, filename))
491
 
        if x == 0:
492
 
            return True
493
 
        elif x == 127:
494
 
            continue
495
 
        else:
496
 
            break
497
 
    raise BzrError("Could not start any editor. Please specify $EDITOR or use ~/.bzr.conf/editor")
498
 
    return False
499
 
                          
500
 
 
501
 
def get_text_message(infotext, ignoreline = "default"):
502
 
    import tempfile
503
 
    
504
 
    if ignoreline == "default":
505
 
        ignoreline = "-- This line and the following will be ignored --"
506
 
        
507
 
    try:
508
 
        tmp_fileno, msgfilename = tempfile.mkstemp()
509
 
        msgfile = os.close(tmp_fileno)
510
 
        if infotext is not None and infotext != "":
511
 
            hasinfo = True
512
 
            msgfile = file(msgfilename, "w")
513
 
            msgfile.write("\n\n%s\n\n%s" % (ignoreline, infotext))
514
 
            msgfile.close()
515
 
        else:
516
 
            hasinfo = False
517
 
 
518
 
        if not _run_editor(msgfilename):
519
 
            return None
520
 
        
521
 
        started = False
522
 
        msg = []
523
 
        lastline, nlines = 0, 0
524
 
        for line in file(msgfilename, "r"):
525
 
            stripped_line = line.strip()
526
 
            # strip empty line before the log message starts
527
 
            if not started:
528
 
                if stripped_line != "":
529
 
                    started = True
530
 
                else:
531
 
                    continue
532
 
            # check for the ignore line only if there
533
 
            # is additional information at the end
534
 
            if hasinfo and stripped_line == ignoreline:
535
 
                break
536
 
            nlines += 1
537
 
            # keep track of the last line that had some content
538
 
            if stripped_line != "":
539
 
                lastline = nlines
540
 
            msg.append(line)
541
 
            
542
 
        if len(msg) == 0:
543
 
            return None
544
 
        # delete empty lines at the end
545
 
        del msg[lastline:]
546
 
        # add a newline at the end, if needed
547
 
        if not msg[-1].endswith("\n"):
548
 
            return "%s%s" % ("".join(msg), "\n")
549
 
        else:
550
 
            return "".join(msg)
551
 
    finally:
552
 
        # delete the msg file in any case
553
 
        try: os.unlink(msgfilename)
554
 
        except IOError: pass
 
843
            width = int(os.environ['COLUMNS'])
 
844
        except:
 
845
            pass
 
846
    if width <= 0:
 
847
        width = 80
 
848
 
 
849
    return width
 
850
 
 
851
def supports_executable():
 
852
    return sys.platform != "win32"
 
853
 
 
854
 
 
855
_validWin32PathRE = re.compile(r'^([A-Za-z]:[/\\])?[^:<>*"?\|]*$')
 
856
 
 
857
 
 
858
def check_legal_path(path):
 
859
    """Check whether the supplied path is legal.  
 
860
    This is only required on Windows, so we don't test on other platforms
 
861
    right now.
 
862
    """
 
863
    if sys.platform != "win32":
 
864
        return
 
865
    if _validWin32PathRE.match(path) is None:
 
866
        raise IllegalPath(path)
 
867
 
 
868
 
 
869
def walkdirs(top, prefix=""):
 
870
    """Yield data about all the directories in a tree.
 
871
    
 
872
    This yields all the data about the contents of a directory at a time.
 
873
    After each directory has been yielded, if the caller has mutated the list
 
874
    to exclude some directories, they are then not descended into.
 
875
    
 
876
    The data yielded is of the form:
 
877
    [(relpath, basename, kind, lstat, path_from_top), ...]
 
878
 
 
879
    :param prefix: Prefix the relpaths that are yielded with 'prefix'. This 
 
880
        allows one to walk a subtree but get paths that are relative to a tree
 
881
        rooted higher up.
 
882
    :return: an iterator over the dirs.
 
883
    """
 
884
    lstat = os.lstat
 
885
    pending = []
 
886
    _directory = _directory_kind
 
887
    _listdir = listdir
 
888
    pending = [(prefix, "", _directory, None, top)]
 
889
    while pending:
 
890
        dirblock = []
 
891
        currentdir = pending.pop()
 
892
        # 0 - relpath, 1- basename, 2- kind, 3- stat, 4-toppath
 
893
        top = currentdir[4]
 
894
        if currentdir[0]:
 
895
            relroot = currentdir[0] + '/'
 
896
        else:
 
897
            relroot = ""
 
898
        for name in sorted(_listdir(top)):
 
899
            abspath = top + '/' + name
 
900
            statvalue = lstat(abspath)
 
901
            dirblock.append ((relroot + name, name, file_kind_from_stat_mode(statvalue.st_mode), statvalue, abspath))
 
902
        yield dirblock
 
903
        # push the user specified dirs from dirblock
 
904
        for dir in reversed(dirblock):
 
905
            if dir[2] == _directory:
 
906
                pending.append(dir)
 
907
 
 
908
 
 
909
def path_prefix_key(path):
 
910
    """Generate a prefix-order path key for path.
 
911
 
 
912
    This can be used to sort paths in the same way that walkdirs does.
 
913
    """
 
914
    return (dirname(path) , path)
 
915
 
 
916
 
 
917
def compare_paths_prefix_order(path_a, path_b):
 
918
    """Compare path_a and path_b to generate the same order walkdirs uses."""
 
919
    key_a = path_prefix_key(path_a)
 
920
    key_b = path_prefix_key(path_b)
 
921
    return cmp(key_a, key_b)