/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/workingtree.py

  • Committer: Martin Pool
  • Date: 2006-05-23 10:51:37 UTC
  • mto: This revision was merged to the branch mainline in revision 1726.
  • Revision ID: mbp@sourcefrog.net-20060523105137-68fc2cc48ec1cd8c
Run bisection search for revision date with lock held. (Robert Widhopf-Frenk)

This is much faster.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005, 2006 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
"""WorkingTree object and friends.
 
18
 
 
19
A WorkingTree represents the editable working copy of a branch.
 
20
Operations which represent the WorkingTree are also done here, 
 
21
such as renaming or adding files.  The WorkingTree has an inventory 
 
22
which is updated by these operations.  A commit produces a 
 
23
new revision based on the workingtree and its inventory.
 
24
 
 
25
At the moment every WorkingTree has its own branch.  Remote
 
26
WorkingTrees aren't supported.
 
27
 
 
28
To get a WorkingTree, call bzrdir.open_workingtree() or
 
29
WorkingTree.open(dir).
 
30
"""
 
31
 
 
32
MERGE_MODIFIED_HEADER_1 = "BZR merge-modified list format 1"
 
33
CONFLICT_HEADER_1 = "BZR conflict list format 1"
 
34
 
 
35
# TODO: Give the workingtree sole responsibility for the working inventory;
 
36
# remove the variable and references to it from the branch.  This may require
 
37
# updating the commit code so as to update the inventory within the working
 
38
# copy, and making sure there's only one WorkingTree for any directory on disk.
 
39
# At the moment they may alias the inventory and have old copies of it in
 
40
# memory.  (Now done? -- mbp 20060309)
 
41
 
 
42
from copy import deepcopy
 
43
from cStringIO import StringIO
 
44
import errno
 
45
import fnmatch
 
46
import os
 
47
import stat
 
48
 
 
49
 
 
50
from bzrlib.atomicfile import AtomicFile
 
51
from bzrlib.branch import (Branch,
 
52
                           quotefn)
 
53
from bzrlib.conflicts import Conflict, ConflictList, CONFLICT_SUFFIXES
 
54
import bzrlib.bzrdir as bzrdir
 
55
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
56
import bzrlib.errors as errors
 
57
from bzrlib.errors import (BzrCheckError,
 
58
                           BzrError,
 
59
                           ConflictFormatError,
 
60
                           DivergedBranches,
 
61
                           WeaveRevisionNotPresent,
 
62
                           NotBranchError,
 
63
                           NoSuchFile,
 
64
                           NotVersionedError,
 
65
                           MergeModifiedFormatError,
 
66
                           UnsupportedOperation,
 
67
                           )
 
68
from bzrlib.inventory import InventoryEntry, Inventory
 
69
from bzrlib.lockable_files import LockableFiles, TransportLock
 
70
from bzrlib.lockdir import LockDir
 
71
from bzrlib.merge import merge_inner, transform_tree
 
72
from bzrlib.osutils import (
 
73
                            abspath,
 
74
                            appendpath,
 
75
                            compact_date,
 
76
                            file_kind,
 
77
                            isdir,
 
78
                            getcwd,
 
79
                            pathjoin,
 
80
                            pumpfile,
 
81
                            safe_unicode,
 
82
                            splitpath,
 
83
                            rand_bytes,
 
84
                            normpath,
 
85
                            realpath,
 
86
                            relpath,
 
87
                            rename,
 
88
                            supports_executable,
 
89
                            )
 
90
from bzrlib.progress import DummyProgress, ProgressPhase
 
91
from bzrlib.revision import NULL_REVISION
 
92
from bzrlib.rio import RioReader, rio_file, Stanza
 
93
from bzrlib.symbol_versioning import *
 
94
from bzrlib.textui import show_status
 
95
import bzrlib.tree
 
96
from bzrlib.transform import build_tree
 
97
from bzrlib.trace import mutter, note
 
98
from bzrlib.transport import get_transport
 
99
from bzrlib.transport.local import LocalTransport
 
100
import bzrlib.ui
 
101
import bzrlib.xml5
 
102
 
 
103
 
 
104
def gen_file_id(name):
 
105
    """Return new file id.
 
106
 
 
107
    This should probably generate proper UUIDs, but for the moment we
 
108
    cope with just randomness because running uuidgen every time is
 
109
    slow."""
 
110
    import re
 
111
    from binascii import hexlify
 
112
    from time import time
 
113
 
 
114
    # get last component
 
115
    idx = name.rfind('/')
 
116
    if idx != -1:
 
117
        name = name[idx+1 : ]
 
118
    idx = name.rfind('\\')
 
119
    if idx != -1:
 
120
        name = name[idx+1 : ]
 
121
 
 
122
    # make it not a hidden file
 
123
    name = name.lstrip('.')
 
124
 
 
125
    # remove any wierd characters; we don't escape them but rather
 
126
    # just pull them out
 
127
    name = re.sub(r'[^\w.]', '', name)
 
128
 
 
129
    s = hexlify(rand_bytes(8))
 
130
    return '-'.join((name, compact_date(time()), s))
 
131
 
 
132
 
 
133
def gen_root_id():
 
134
    """Return a new tree-root file id."""
 
135
    return gen_file_id('TREE_ROOT')
 
136
 
 
137
 
 
138
class TreeEntry(object):
 
139
    """An entry that implements the minium interface used by commands.
 
140
 
 
141
    This needs further inspection, it may be better to have 
 
142
    InventoryEntries without ids - though that seems wrong. For now,
 
143
    this is a parallel hierarchy to InventoryEntry, and needs to become
 
144
    one of several things: decorates to that hierarchy, children of, or
 
145
    parents of it.
 
146
    Another note is that these objects are currently only used when there is
 
147
    no InventoryEntry available - i.e. for unversioned objects.
 
148
    Perhaps they should be UnversionedEntry et al. ? - RBC 20051003
 
149
    """
 
150
 
 
151
    def __eq__(self, other):
 
152
        # yes, this us ugly, TODO: best practice __eq__ style.
 
153
        return (isinstance(other, TreeEntry)
 
154
                and other.__class__ == self.__class__)
 
155
 
 
156
    def kind_character(self):
 
157
        return "???"
 
158
 
 
159
 
 
160
class TreeDirectory(TreeEntry):
 
161
    """See TreeEntry. This is a directory in a working tree."""
 
162
 
 
163
    def __eq__(self, other):
 
164
        return (isinstance(other, TreeDirectory)
 
165
                and other.__class__ == self.__class__)
 
166
 
 
167
    def kind_character(self):
 
168
        return "/"
 
169
 
 
170
 
 
171
class TreeFile(TreeEntry):
 
172
    """See TreeEntry. This is a regular file in a working tree."""
 
173
 
 
174
    def __eq__(self, other):
 
175
        return (isinstance(other, TreeFile)
 
176
                and other.__class__ == self.__class__)
 
177
 
 
178
    def kind_character(self):
 
179
        return ''
 
180
 
 
181
 
 
182
class TreeLink(TreeEntry):
 
183
    """See TreeEntry. This is a symlink in a working tree."""
 
184
 
 
185
    def __eq__(self, other):
 
186
        return (isinstance(other, TreeLink)
 
187
                and other.__class__ == self.__class__)
 
188
 
 
189
    def kind_character(self):
 
190
        return ''
 
191
 
 
192
 
 
193
class WorkingTree(bzrlib.tree.Tree):
 
194
    """Working copy tree.
 
195
 
 
196
    The inventory is held in the `Branch` working-inventory, and the
 
197
    files are in a directory on disk.
 
198
 
 
199
    It is possible for a `WorkingTree` to have a filename which is
 
200
    not listed in the Inventory and vice versa.
 
201
    """
 
202
 
 
203
    def __init__(self, basedir='.',
 
204
                 branch=DEPRECATED_PARAMETER,
 
205
                 _inventory=None,
 
206
                 _control_files=None,
 
207
                 _internal=False,
 
208
                 _format=None,
 
209
                 _bzrdir=None):
 
210
        """Construct a WorkingTree for basedir.
 
211
 
 
212
        If the branch is not supplied, it is opened automatically.
 
213
        If the branch is supplied, it must be the branch for this basedir.
 
214
        (branch.base is not cross checked, because for remote branches that
 
215
        would be meaningless).
 
216
        """
 
217
        self._format = _format
 
218
        self.bzrdir = _bzrdir
 
219
        if not _internal:
 
220
            # not created via open etc.
 
221
            warn("WorkingTree() is deprecated as of bzr version 0.8. "
 
222
                 "Please use bzrdir.open_workingtree or WorkingTree.open().",
 
223
                 DeprecationWarning,
 
224
                 stacklevel=2)
 
225
            wt = WorkingTree.open(basedir)
 
226
            self._branch = wt.branch
 
227
            self.basedir = wt.basedir
 
228
            self._control_files = wt._control_files
 
229
            self._hashcache = wt._hashcache
 
230
            self._set_inventory(wt._inventory)
 
231
            self._format = wt._format
 
232
            self.bzrdir = wt.bzrdir
 
233
        from bzrlib.hashcache import HashCache
 
234
        from bzrlib.trace import note, mutter
 
235
        assert isinstance(basedir, basestring), \
 
236
            "base directory %r is not a string" % basedir
 
237
        basedir = safe_unicode(basedir)
 
238
        mutter("opening working tree %r", basedir)
 
239
        if deprecated_passed(branch):
 
240
            if not _internal:
 
241
                warn("WorkingTree(..., branch=XXX) is deprecated as of bzr 0.8."
 
242
                     " Please use bzrdir.open_workingtree() or"
 
243
                     " WorkingTree.open().",
 
244
                     DeprecationWarning,
 
245
                     stacklevel=2
 
246
                     )
 
247
            self._branch = branch
 
248
        else:
 
249
            self._branch = self.bzrdir.open_branch()
 
250
        assert isinstance(self.branch, Branch), \
 
251
            "branch %r is not a Branch" % self.branch
 
252
        self.basedir = realpath(basedir)
 
253
        # if branch is at our basedir and is a format 6 or less
 
254
        if isinstance(self._format, WorkingTreeFormat2):
 
255
            # share control object
 
256
            self._control_files = self.branch.control_files
 
257
        else:
 
258
            # only ready for format 3
 
259
            assert isinstance(self._format, WorkingTreeFormat3)
 
260
            assert isinstance(_control_files, LockableFiles), \
 
261
                    "_control_files must be a LockableFiles, not %r" \
 
262
                    % _control_files
 
263
            self._control_files = _control_files
 
264
        # update the whole cache up front and write to disk if anything changed;
 
265
        # in the future we might want to do this more selectively
 
266
        # two possible ways offer themselves : in self._unlock, write the cache
 
267
        # if needed, or, when the cache sees a change, append it to the hash
 
268
        # cache file, and have the parser take the most recent entry for a
 
269
        # given path only.
 
270
        cache_filename = self.bzrdir.get_workingtree_transport(None).abspath('stat-cache')
 
271
        hc = self._hashcache = HashCache(basedir, cache_filename, self._control_files._file_mode)
 
272
        hc.read()
 
273
        # is this scan needed ? it makes things kinda slow.
 
274
        hc.scan()
 
275
 
 
276
        if hc.needs_write:
 
277
            mutter("write hc")
 
278
            hc.write()
 
279
 
 
280
        if _inventory is None:
 
281
            self._set_inventory(self.read_working_inventory())
 
282
        else:
 
283
            self._set_inventory(_inventory)
 
284
 
 
285
    branch = property(
 
286
        fget=lambda self: self._branch,
 
287
        doc="""The branch this WorkingTree is connected to.
 
288
 
 
289
            This cannot be set - it is reflective of the actual disk structure
 
290
            the working tree has been constructed from.
 
291
            """)
 
292
 
 
293
    def break_lock(self):
 
294
        """Break a lock if one is present from another instance.
 
295
 
 
296
        Uses the ui factory to ask for confirmation if the lock may be from
 
297
        an active process.
 
298
 
 
299
        This will probe the repository for its lock as well.
 
300
        """
 
301
        self._control_files.break_lock()
 
302
        self.branch.break_lock()
 
303
 
 
304
    def _set_inventory(self, inv):
 
305
        self._inventory = inv
 
306
        self.path2id = self._inventory.path2id
 
307
 
 
308
    def is_control_filename(self, filename):
 
309
        """True if filename is the name of a control file in this tree.
 
310
        
 
311
        This is true IF and ONLY IF the filename is part of the meta data
 
312
        that bzr controls in this tree. I.E. a random .bzr directory placed
 
313
        on disk will not be a control file for this tree.
 
314
        """
 
315
        try:
 
316
            self.bzrdir.transport.relpath(self.abspath(filename))
 
317
            return True
 
318
        except errors.PathNotChild:
 
319
            return False
 
320
 
 
321
    @staticmethod
 
322
    def open(path=None, _unsupported=False):
 
323
        """Open an existing working tree at path.
 
324
 
 
325
        """
 
326
        if path is None:
 
327
            path = os.path.getcwdu()
 
328
        control = bzrdir.BzrDir.open(path, _unsupported)
 
329
        return control.open_workingtree(_unsupported)
 
330
        
 
331
    @staticmethod
 
332
    def open_containing(path=None):
 
333
        """Open an existing working tree which has its root about path.
 
334
        
 
335
        This probes for a working tree at path and searches upwards from there.
 
336
 
 
337
        Basically we keep looking up until we find the control directory or
 
338
        run into /.  If there isn't one, raises NotBranchError.
 
339
        TODO: give this a new exception.
 
340
        If there is one, it is returned, along with the unused portion of path.
 
341
        """
 
342
        if path is None:
 
343
            path = os.getcwdu()
 
344
        control, relpath = bzrdir.BzrDir.open_containing(path)
 
345
        return control.open_workingtree(), relpath
 
346
 
 
347
    @staticmethod
 
348
    def open_downlevel(path=None):
 
349
        """Open an unsupported working tree.
 
350
 
 
351
        Only intended for advanced situations like upgrading part of a bzrdir.
 
352
        """
 
353
        return WorkingTree.open(path, _unsupported=True)
 
354
 
 
355
    def __iter__(self):
 
356
        """Iterate through file_ids for this tree.
 
357
 
 
358
        file_ids are in a WorkingTree if they are in the working inventory
 
359
        and the working file exists.
 
360
        """
 
361
        inv = self._inventory
 
362
        for path, ie in inv.iter_entries():
 
363
            if bzrlib.osutils.lexists(self.abspath(path)):
 
364
                yield ie.file_id
 
365
 
 
366
    def __repr__(self):
 
367
        return "<%s of %s>" % (self.__class__.__name__,
 
368
                               getattr(self, 'basedir', None))
 
369
 
 
370
    def abspath(self, filename):
 
371
        return pathjoin(self.basedir, filename)
 
372
    
 
373
    def basis_tree(self):
 
374
        """Return RevisionTree for the current last revision."""
 
375
        revision_id = self.last_revision()
 
376
        if revision_id is not None:
 
377
            try:
 
378
                xml = self.read_basis_inventory()
 
379
                inv = bzrlib.xml5.serializer_v5.read_inventory_from_string(xml)
 
380
            except NoSuchFile:
 
381
                inv = None
 
382
            if inv is not None and inv.revision_id == revision_id:
 
383
                return bzrlib.tree.RevisionTree(self.branch.repository, inv,
 
384
                                                revision_id)
 
385
        # FIXME? RBC 20060403 should we cache the inventory here ?
 
386
        return self.branch.repository.revision_tree(revision_id)
 
387
 
 
388
    @staticmethod
 
389
    @deprecated_method(zero_eight)
 
390
    def create(branch, directory):
 
391
        """Create a workingtree for branch at directory.
 
392
 
 
393
        If existing_directory already exists it must have a .bzr directory.
 
394
        If it does not exist, it will be created.
 
395
 
 
396
        This returns a new WorkingTree object for the new checkout.
 
397
 
 
398
        TODO FIXME RBC 20060124 when we have checkout formats in place this
 
399
        should accept an optional revisionid to checkout [and reject this if
 
400
        checking out into the same dir as a pre-checkout-aware branch format.]
 
401
 
 
402
        XXX: When BzrDir is present, these should be created through that 
 
403
        interface instead.
 
404
        """
 
405
        warn('delete WorkingTree.create', stacklevel=3)
 
406
        transport = get_transport(directory)
 
407
        if branch.bzrdir.root_transport.base == transport.base:
 
408
            # same dir 
 
409
            return branch.bzrdir.create_workingtree()
 
410
        # different directory, 
 
411
        # create a branch reference
 
412
        # and now a working tree.
 
413
        raise NotImplementedError
 
414
 
 
415
    @staticmethod
 
416
    @deprecated_method(zero_eight)
 
417
    def create_standalone(directory):
 
418
        """Create a checkout and a branch and a repo at directory.
 
419
 
 
420
        Directory must exist and be empty.
 
421
 
 
422
        please use BzrDir.create_standalone_workingtree
 
423
        """
 
424
        return bzrdir.BzrDir.create_standalone_workingtree(directory)
 
425
 
 
426
    def relpath(self, abs):
 
427
        """Return the local path portion from a given absolute path."""
 
428
        return relpath(self.basedir, abs)
 
429
 
 
430
    def has_filename(self, filename):
 
431
        return bzrlib.osutils.lexists(self.abspath(filename))
 
432
 
 
433
    def get_file(self, file_id):
 
434
        return self.get_file_byname(self.id2path(file_id))
 
435
 
 
436
    def get_file_byname(self, filename):
 
437
        return file(self.abspath(filename), 'rb')
 
438
 
 
439
    def get_root_id(self):
 
440
        """Return the id of this trees root"""
 
441
        inv = self.read_working_inventory()
 
442
        return inv.root.file_id
 
443
        
 
444
    def _get_store_filename(self, file_id):
 
445
        ## XXX: badly named; this is not in the store at all
 
446
        return self.abspath(self.id2path(file_id))
 
447
 
 
448
    @needs_read_lock
 
449
    def clone(self, to_bzrdir, revision_id=None, basis=None):
 
450
        """Duplicate this working tree into to_bzr, including all state.
 
451
        
 
452
        Specifically modified files are kept as modified, but
 
453
        ignored and unknown files are discarded.
 
454
 
 
455
        If you want to make a new line of development, see bzrdir.sprout()
 
456
 
 
457
        revision
 
458
            If not None, the cloned tree will have its last revision set to 
 
459
            revision, and and difference between the source trees last revision
 
460
            and this one merged in.
 
461
 
 
462
        basis
 
463
            If not None, a closer copy of a tree which may have some files in
 
464
            common, and which file content should be preferentially copied from.
 
465
        """
 
466
        # assumes the target bzr dir format is compatible.
 
467
        result = self._format.initialize(to_bzrdir)
 
468
        self.copy_content_into(result, revision_id)
 
469
        return result
 
470
 
 
471
    @needs_read_lock
 
472
    def copy_content_into(self, tree, revision_id=None):
 
473
        """Copy the current content and user files of this tree into tree."""
 
474
        if revision_id is None:
 
475
            transform_tree(tree, self)
 
476
        else:
 
477
            # TODO now merge from tree.last_revision to revision
 
478
            transform_tree(tree, self)
 
479
            tree.set_last_revision(revision_id)
 
480
 
 
481
    @needs_write_lock
 
482
    def commit(self, message=None, revprops=None, *args, **kwargs):
 
483
        # avoid circular imports
 
484
        from bzrlib.commit import Commit
 
485
        if revprops is None:
 
486
            revprops = {}
 
487
        if not 'branch-nick' in revprops:
 
488
            revprops['branch-nick'] = self.branch.nick
 
489
        # args for wt.commit start at message from the Commit.commit method,
 
490
        # but with branch a kwarg now, passing in args as is results in the
 
491
        #message being used for the branch
 
492
        args = (DEPRECATED_PARAMETER, message, ) + args
 
493
        Commit().commit(working_tree=self, revprops=revprops, *args, **kwargs)
 
494
        self._set_inventory(self.read_working_inventory())
 
495
 
 
496
    def id2abspath(self, file_id):
 
497
        return self.abspath(self.id2path(file_id))
 
498
 
 
499
    def has_id(self, file_id):
 
500
        # files that have been deleted are excluded
 
501
        inv = self._inventory
 
502
        if not inv.has_id(file_id):
 
503
            return False
 
504
        path = inv.id2path(file_id)
 
505
        return bzrlib.osutils.lexists(self.abspath(path))
 
506
 
 
507
    def has_or_had_id(self, file_id):
 
508
        if file_id == self.inventory.root.file_id:
 
509
            return True
 
510
        return self.inventory.has_id(file_id)
 
511
 
 
512
    __contains__ = has_id
 
513
 
 
514
    def get_file_size(self, file_id):
 
515
        return os.path.getsize(self.id2abspath(file_id))
 
516
 
 
517
    @needs_read_lock
 
518
    def get_file_sha1(self, file_id):
 
519
        path = self._inventory.id2path(file_id)
 
520
        return self._hashcache.get_sha1(path)
 
521
 
 
522
    def is_executable(self, file_id):
 
523
        if not supports_executable():
 
524
            return self._inventory[file_id].executable
 
525
        else:
 
526
            path = self._inventory.id2path(file_id)
 
527
            mode = os.lstat(self.abspath(path)).st_mode
 
528
            return bool(stat.S_ISREG(mode) and stat.S_IEXEC&mode)
 
529
 
 
530
    @needs_write_lock
 
531
    def add(self, files, ids=None):
 
532
        """Make files versioned.
 
533
 
 
534
        Note that the command line normally calls smart_add instead,
 
535
        which can automatically recurse.
 
536
 
 
537
        This adds the files to the inventory, so that they will be
 
538
        recorded by the next commit.
 
539
 
 
540
        files
 
541
            List of paths to add, relative to the base of the tree.
 
542
 
 
543
        ids
 
544
            If set, use these instead of automatically generated ids.
 
545
            Must be the same length as the list of files, but may
 
546
            contain None for ids that are to be autogenerated.
 
547
 
 
548
        TODO: Perhaps have an option to add the ids even if the files do
 
549
              not (yet) exist.
 
550
 
 
551
        TODO: Perhaps callback with the ids and paths as they're added.
 
552
        """
 
553
        # TODO: Re-adding a file that is removed in the working copy
 
554
        # should probably put it back with the previous ID.
 
555
        if isinstance(files, basestring):
 
556
            assert(ids is None or isinstance(ids, basestring))
 
557
            files = [files]
 
558
            if ids is not None:
 
559
                ids = [ids]
 
560
 
 
561
        if ids is None:
 
562
            ids = [None] * len(files)
 
563
        else:
 
564
            assert(len(ids) == len(files))
 
565
 
 
566
        inv = self.read_working_inventory()
 
567
        for f,file_id in zip(files, ids):
 
568
            if self.is_control_filename(f):
 
569
                raise BzrError("cannot add control file %s" % quotefn(f))
 
570
 
 
571
            fp = splitpath(f)
 
572
 
 
573
            if len(fp) == 0:
 
574
                raise BzrError("cannot add top-level %r" % f)
 
575
 
 
576
            fullpath = normpath(self.abspath(f))
 
577
 
 
578
            try:
 
579
                kind = file_kind(fullpath)
 
580
            except OSError, e:
 
581
                if e.errno == errno.ENOENT:
 
582
                    raise NoSuchFile(fullpath)
 
583
                # maybe something better?
 
584
                raise BzrError('cannot add: not a regular file, symlink or directory: %s' % quotefn(f))
 
585
 
 
586
            if not InventoryEntry.versionable_kind(kind):
 
587
                raise BzrError('cannot add: not a versionable file ('
 
588
                               'i.e. regular file, symlink or directory): %s' % quotefn(f))
 
589
 
 
590
            if file_id is None:
 
591
                file_id = gen_file_id(f)
 
592
            inv.add_path(f, kind=kind, file_id=file_id)
 
593
 
 
594
            mutter("add file %s file_id:{%s} kind=%r" % (f, file_id, kind))
 
595
        self._write_inventory(inv)
 
596
 
 
597
    @needs_write_lock
 
598
    def add_pending_merge(self, *revision_ids):
 
599
        # TODO: Perhaps should check at this point that the
 
600
        # history of the revision is actually present?
 
601
        p = self.pending_merges()
 
602
        updated = False
 
603
        for rev_id in revision_ids:
 
604
            if rev_id in p:
 
605
                continue
 
606
            p.append(rev_id)
 
607
            updated = True
 
608
        if updated:
 
609
            self.set_pending_merges(p)
 
610
 
 
611
    @needs_read_lock
 
612
    def pending_merges(self):
 
613
        """Return a list of pending merges.
 
614
 
 
615
        These are revisions that have been merged into the working
 
616
        directory but not yet committed.
 
617
        """
 
618
        try:
 
619
            merges_file = self._control_files.get_utf8('pending-merges')
 
620
        except OSError, e:
 
621
            if e.errno != errno.ENOENT:
 
622
                raise
 
623
            return []
 
624
        p = []
 
625
        for l in merges_file.readlines():
 
626
            p.append(l.rstrip('\n'))
 
627
        return p
 
628
 
 
629
    @needs_write_lock
 
630
    def set_pending_merges(self, rev_list):
 
631
        self._control_files.put_utf8('pending-merges', '\n'.join(rev_list))
 
632
 
 
633
    @needs_write_lock
 
634
    def set_merge_modified(self, modified_hashes):
 
635
        def iter_stanzas():
 
636
            for file_id, hash in modified_hashes.iteritems():
 
637
                yield Stanza(file_id=file_id, hash=hash)
 
638
        self._put_rio('merge-hashes', iter_stanzas(), MERGE_MODIFIED_HEADER_1)
 
639
 
 
640
    @needs_write_lock
 
641
    def _put_rio(self, filename, stanzas, header):
 
642
        my_file = rio_file(stanzas, header)
 
643
        self._control_files.put(filename, my_file)
 
644
 
 
645
    @needs_read_lock
 
646
    def merge_modified(self):
 
647
        try:
 
648
            hashfile = self._control_files.get('merge-hashes')
 
649
        except NoSuchFile:
 
650
            return {}
 
651
        merge_hashes = {}
 
652
        try:
 
653
            if hashfile.next() != MERGE_MODIFIED_HEADER_1 + '\n':
 
654
                raise MergeModifiedFormatError()
 
655
        except StopIteration:
 
656
            raise MergeModifiedFormatError()
 
657
        for s in RioReader(hashfile):
 
658
            file_id = s.get("file_id")
 
659
            if file_id not in self.inventory:
 
660
                continue
 
661
            hash = s.get("hash")
 
662
            if hash == self.get_file_sha1(file_id):
 
663
                merge_hashes[file_id] = hash
 
664
        return merge_hashes
 
665
 
 
666
    def get_symlink_target(self, file_id):
 
667
        return os.readlink(self.id2abspath(file_id))
 
668
 
 
669
    def file_class(self, filename):
 
670
        if self.path2id(filename):
 
671
            return 'V'
 
672
        elif self.is_ignored(filename):
 
673
            return 'I'
 
674
        else:
 
675
            return '?'
 
676
 
 
677
    def list_files(self):
 
678
        """Recursively list all files as (path, class, kind, id).
 
679
 
 
680
        Lists, but does not descend into unversioned directories.
 
681
 
 
682
        This does not include files that have been deleted in this
 
683
        tree.
 
684
 
 
685
        Skips the control directory.
 
686
        """
 
687
        inv = self._inventory
 
688
 
 
689
        def descend(from_dir_relpath, from_dir_id, dp):
 
690
            ls = os.listdir(dp)
 
691
            ls.sort()
 
692
            for f in ls:
 
693
                ## TODO: If we find a subdirectory with its own .bzr
 
694
                ## directory, then that is a separate tree and we
 
695
                ## should exclude it.
 
696
 
 
697
                # the bzrdir for this tree
 
698
                if self.bzrdir.transport.base.endswith(f + '/'):
 
699
                    continue
 
700
 
 
701
                # path within tree
 
702
                fp = appendpath(from_dir_relpath, f)
 
703
 
 
704
                # absolute path
 
705
                fap = appendpath(dp, f)
 
706
                
 
707
                f_ie = inv.get_child(from_dir_id, f)
 
708
                if f_ie:
 
709
                    c = 'V'
 
710
                elif self.is_ignored(fp):
 
711
                    c = 'I'
 
712
                else:
 
713
                    c = '?'
 
714
 
 
715
                fk = file_kind(fap)
 
716
 
 
717
                if f_ie:
 
718
                    if f_ie.kind != fk:
 
719
                        raise BzrCheckError("file %r entered as kind %r id %r, "
 
720
                                            "now of kind %r"
 
721
                                            % (fap, f_ie.kind, f_ie.file_id, fk))
 
722
 
 
723
                # make a last minute entry
 
724
                if f_ie:
 
725
                    entry = f_ie
 
726
                else:
 
727
                    if fk == 'directory':
 
728
                        entry = TreeDirectory()
 
729
                    elif fk == 'file':
 
730
                        entry = TreeFile()
 
731
                    elif fk == 'symlink':
 
732
                        entry = TreeLink()
 
733
                    else:
 
734
                        entry = TreeEntry()
 
735
                
 
736
                yield fp, c, fk, (f_ie and f_ie.file_id), entry
 
737
 
 
738
                if fk != 'directory':
 
739
                    continue
 
740
 
 
741
                if c != 'V':
 
742
                    # don't descend unversioned directories
 
743
                    continue
 
744
                
 
745
                for ff in descend(fp, f_ie.file_id, fap):
 
746
                    yield ff
 
747
 
 
748
        for f in descend(u'', inv.root.file_id, self.basedir):
 
749
            yield f
 
750
 
 
751
    @needs_write_lock
 
752
    def move(self, from_paths, to_name):
 
753
        """Rename files.
 
754
 
 
755
        to_name must exist in the inventory.
 
756
 
 
757
        If to_name exists and is a directory, the files are moved into
 
758
        it, keeping their old names.  
 
759
 
 
760
        Note that to_name is only the last component of the new name;
 
761
        this doesn't change the directory.
 
762
 
 
763
        This returns a list of (from_path, to_path) pairs for each
 
764
        entry that is moved.
 
765
        """
 
766
        result = []
 
767
        ## TODO: Option to move IDs only
 
768
        assert not isinstance(from_paths, basestring)
 
769
        inv = self.inventory
 
770
        to_abs = self.abspath(to_name)
 
771
        if not isdir(to_abs):
 
772
            raise BzrError("destination %r is not a directory" % to_abs)
 
773
        if not self.has_filename(to_name):
 
774
            raise BzrError("destination %r not in working directory" % to_abs)
 
775
        to_dir_id = inv.path2id(to_name)
 
776
        if to_dir_id == None and to_name != '':
 
777
            raise BzrError("destination %r is not a versioned directory" % to_name)
 
778
        to_dir_ie = inv[to_dir_id]
 
779
        if to_dir_ie.kind not in ('directory', 'root_directory'):
 
780
            raise BzrError("destination %r is not a directory" % to_abs)
 
781
 
 
782
        to_idpath = inv.get_idpath(to_dir_id)
 
783
 
 
784
        for f in from_paths:
 
785
            if not self.has_filename(f):
 
786
                raise BzrError("%r does not exist in working tree" % f)
 
787
            f_id = inv.path2id(f)
 
788
            if f_id == None:
 
789
                raise BzrError("%r is not versioned" % f)
 
790
            name_tail = splitpath(f)[-1]
 
791
            dest_path = appendpath(to_name, name_tail)
 
792
            if self.has_filename(dest_path):
 
793
                raise BzrError("destination %r already exists" % dest_path)
 
794
            if f_id in to_idpath:
 
795
                raise BzrError("can't move %r to a subdirectory of itself" % f)
 
796
 
 
797
        # OK, so there's a race here, it's possible that someone will
 
798
        # create a file in this interval and then the rename might be
 
799
        # left half-done.  But we should have caught most problems.
 
800
        orig_inv = deepcopy(self.inventory)
 
801
        try:
 
802
            for f in from_paths:
 
803
                name_tail = splitpath(f)[-1]
 
804
                dest_path = appendpath(to_name, name_tail)
 
805
                result.append((f, dest_path))
 
806
                inv.rename(inv.path2id(f), to_dir_id, name_tail)
 
807
                try:
 
808
                    rename(self.abspath(f), self.abspath(dest_path))
 
809
                except OSError, e:
 
810
                    raise BzrError("failed to rename %r to %r: %s" %
 
811
                                   (f, dest_path, e[1]),
 
812
                            ["rename rolled back"])
 
813
        except:
 
814
            # restore the inventory on error
 
815
            self._set_inventory(orig_inv)
 
816
            raise
 
817
        self._write_inventory(inv)
 
818
        return result
 
819
 
 
820
    @needs_write_lock
 
821
    def rename_one(self, from_rel, to_rel):
 
822
        """Rename one file.
 
823
 
 
824
        This can change the directory or the filename or both.
 
825
        """
 
826
        inv = self.inventory
 
827
        if not self.has_filename(from_rel):
 
828
            raise BzrError("can't rename: old working file %r does not exist" % from_rel)
 
829
        if self.has_filename(to_rel):
 
830
            raise BzrError("can't rename: new working file %r already exists" % to_rel)
 
831
 
 
832
        file_id = inv.path2id(from_rel)
 
833
        if file_id == None:
 
834
            raise BzrError("can't rename: old name %r is not versioned" % from_rel)
 
835
 
 
836
        entry = inv[file_id]
 
837
        from_parent = entry.parent_id
 
838
        from_name = entry.name
 
839
        
 
840
        if inv.path2id(to_rel):
 
841
            raise BzrError("can't rename: new name %r is already versioned" % to_rel)
 
842
 
 
843
        to_dir, to_tail = os.path.split(to_rel)
 
844
        to_dir_id = inv.path2id(to_dir)
 
845
        if to_dir_id == None and to_dir != '':
 
846
            raise BzrError("can't determine destination directory id for %r" % to_dir)
 
847
 
 
848
        mutter("rename_one:")
 
849
        mutter("  file_id    {%s}" % file_id)
 
850
        mutter("  from_rel   %r" % from_rel)
 
851
        mutter("  to_rel     %r" % to_rel)
 
852
        mutter("  to_dir     %r" % to_dir)
 
853
        mutter("  to_dir_id  {%s}" % to_dir_id)
 
854
 
 
855
        inv.rename(file_id, to_dir_id, to_tail)
 
856
 
 
857
        from_abs = self.abspath(from_rel)
 
858
        to_abs = self.abspath(to_rel)
 
859
        try:
 
860
            rename(from_abs, to_abs)
 
861
        except OSError, e:
 
862
            inv.rename(file_id, from_parent, from_name)
 
863
            raise BzrError("failed to rename %r to %r: %s"
 
864
                    % (from_abs, to_abs, e[1]),
 
865
                    ["rename rolled back"])
 
866
        self._write_inventory(inv)
 
867
 
 
868
    @needs_read_lock
 
869
    def unknowns(self):
 
870
        """Return all unknown files.
 
871
 
 
872
        These are files in the working directory that are not versioned or
 
873
        control files or ignored.
 
874
        
 
875
        >>> from bzrlib.bzrdir import ScratchDir
 
876
        >>> d = ScratchDir(files=['foo', 'foo~'])
 
877
        >>> b = d.open_branch()
 
878
        >>> tree = d.open_workingtree()
 
879
        >>> map(str, tree.unknowns())
 
880
        ['foo']
 
881
        >>> tree.add('foo')
 
882
        >>> list(b.unknowns())
 
883
        []
 
884
        >>> tree.remove('foo')
 
885
        >>> list(b.unknowns())
 
886
        [u'foo']
 
887
        """
 
888
        for subp in self.extras():
 
889
            if not self.is_ignored(subp):
 
890
                yield subp
 
891
 
 
892
    @deprecated_method(zero_eight)
 
893
    def iter_conflicts(self):
 
894
        """List all files in the tree that have text or content conflicts.
 
895
        DEPRECATED.  Use conflicts instead."""
 
896
        return self._iter_conflicts()
 
897
 
 
898
    def _iter_conflicts(self):
 
899
        conflicted = set()
 
900
        for path in (s[0] for s in self.list_files()):
 
901
            stem = get_conflicted_stem(path)
 
902
            if stem is None:
 
903
                continue
 
904
            if stem not in conflicted:
 
905
                conflicted.add(stem)
 
906
                yield stem
 
907
 
 
908
    @needs_write_lock
 
909
    def pull(self, source, overwrite=False, stop_revision=None):
 
910
        top_pb = bzrlib.ui.ui_factory.nested_progress_bar()
 
911
        source.lock_read()
 
912
        try:
 
913
            pp = ProgressPhase("Pull phase", 2, top_pb)
 
914
            pp.next_phase()
 
915
            old_revision_history = self.branch.revision_history()
 
916
            basis_tree = self.basis_tree()
 
917
            count = self.branch.pull(source, overwrite, stop_revision)
 
918
            new_revision_history = self.branch.revision_history()
 
919
            if new_revision_history != old_revision_history:
 
920
                pp.next_phase()
 
921
                if len(old_revision_history):
 
922
                    other_revision = old_revision_history[-1]
 
923
                else:
 
924
                    other_revision = None
 
925
                repository = self.branch.repository
 
926
                pb = bzrlib.ui.ui_factory.nested_progress_bar()
 
927
                try:
 
928
                    merge_inner(self.branch,
 
929
                                self.branch.basis_tree(),
 
930
                                basis_tree, 
 
931
                                this_tree=self, 
 
932
                                pb=pb)
 
933
                finally:
 
934
                    pb.finished()
 
935
                self.set_last_revision(self.branch.last_revision())
 
936
            return count
 
937
        finally:
 
938
            source.unlock()
 
939
            top_pb.finished()
 
940
 
 
941
    def extras(self):
 
942
        """Yield all unknown files in this WorkingTree.
 
943
 
 
944
        If there are any unknown directories then only the directory is
 
945
        returned, not all its children.  But if there are unknown files
 
946
        under a versioned subdirectory, they are returned.
 
947
 
 
948
        Currently returned depth-first, sorted by name within directories.
 
949
        """
 
950
        ## TODO: Work from given directory downwards
 
951
        for path, dir_entry in self.inventory.directories():
 
952
            mutter("search for unknowns in %r", path)
 
953
            dirabs = self.abspath(path)
 
954
            if not isdir(dirabs):
 
955
                # e.g. directory deleted
 
956
                continue
 
957
 
 
958
            fl = []
 
959
            for subf in os.listdir(dirabs):
 
960
                if (subf != '.bzr'
 
961
                    and (subf not in dir_entry.children)):
 
962
                    fl.append(subf)
 
963
            
 
964
            fl.sort()
 
965
            for subf in fl:
 
966
                subp = appendpath(path, subf)
 
967
                yield subp
 
968
 
 
969
 
 
970
    def ignored_files(self):
 
971
        """Yield list of PATH, IGNORE_PATTERN"""
 
972
        for subp in self.extras():
 
973
            pat = self.is_ignored(subp)
 
974
            if pat != None:
 
975
                yield subp, pat
 
976
 
 
977
 
 
978
    def get_ignore_list(self):
 
979
        """Return list of ignore patterns.
 
980
 
 
981
        Cached in the Tree object after the first call.
 
982
        """
 
983
        if hasattr(self, '_ignorelist'):
 
984
            return self._ignorelist
 
985
 
 
986
        l = bzrlib.DEFAULT_IGNORE[:]
 
987
        if self.has_filename(bzrlib.IGNORE_FILENAME):
 
988
            f = self.get_file_byname(bzrlib.IGNORE_FILENAME)
 
989
            l.extend([line.rstrip("\n\r") for line in f.readlines()])
 
990
        self._ignorelist = l
 
991
        return l
 
992
 
 
993
 
 
994
    def is_ignored(self, filename):
 
995
        r"""Check whether the filename matches an ignore pattern.
 
996
 
 
997
        Patterns containing '/' or '\' need to match the whole path;
 
998
        others match against only the last component.
 
999
 
 
1000
        If the file is ignored, returns the pattern which caused it to
 
1001
        be ignored, otherwise None.  So this can simply be used as a
 
1002
        boolean if desired."""
 
1003
 
 
1004
        # TODO: Use '**' to match directories, and other extended
 
1005
        # globbing stuff from cvs/rsync.
 
1006
 
 
1007
        # XXX: fnmatch is actually not quite what we want: it's only
 
1008
        # approximately the same as real Unix fnmatch, and doesn't
 
1009
        # treat dotfiles correctly and allows * to match /.
 
1010
        # Eventually it should be replaced with something more
 
1011
        # accurate.
 
1012
        
 
1013
        basename = splitpath(filename)[-1]
 
1014
        for pat in self.get_ignore_list():
 
1015
            if '/' in pat or '\\' in pat:
 
1016
                
 
1017
                # as a special case, you can put ./ at the start of a
 
1018
                # pattern; this is good to match in the top-level
 
1019
                # only;
 
1020
                if pat[:2] in ('./', '.\\'):
 
1021
                    newpat = pat[2:]
 
1022
                else:
 
1023
                    newpat = pat
 
1024
                if fnmatch.fnmatchcase(filename, newpat):
 
1025
                    return pat
 
1026
            else:
 
1027
                if fnmatch.fnmatchcase(basename, pat):
 
1028
                    return pat
 
1029
        return None
 
1030
 
 
1031
    def kind(self, file_id):
 
1032
        return file_kind(self.id2abspath(file_id))
 
1033
 
 
1034
    @needs_read_lock
 
1035
    def last_revision(self):
 
1036
        """Return the last revision id of this working tree.
 
1037
 
 
1038
        In early branch formats this was == the branch last_revision,
 
1039
        but that cannot be relied upon - for working tree operations,
 
1040
        always use tree.last_revision().
 
1041
        """
 
1042
        return self.branch.last_revision()
 
1043
 
 
1044
    def is_locked(self):
 
1045
        return self._control_files.is_locked()
 
1046
 
 
1047
    def lock_read(self):
 
1048
        """See Branch.lock_read, and WorkingTree.unlock."""
 
1049
        self.branch.lock_read()
 
1050
        try:
 
1051
            return self._control_files.lock_read()
 
1052
        except:
 
1053
            self.branch.unlock()
 
1054
            raise
 
1055
 
 
1056
    def lock_write(self):
 
1057
        """See Branch.lock_write, and WorkingTree.unlock."""
 
1058
        self.branch.lock_write()
 
1059
        try:
 
1060
            return self._control_files.lock_write()
 
1061
        except:
 
1062
            self.branch.unlock()
 
1063
            raise
 
1064
 
 
1065
    def get_physical_lock_status(self):
 
1066
        return self._control_files.get_physical_lock_status()
 
1067
 
 
1068
    def _basis_inventory_name(self):
 
1069
        return 'basis-inventory'
 
1070
 
 
1071
    @needs_write_lock
 
1072
    def set_last_revision(self, new_revision):
 
1073
        """Change the last revision in the working tree."""
 
1074
        if self._change_last_revision(new_revision):
 
1075
            self._cache_basis_inventory(new_revision)
 
1076
 
 
1077
    def _change_last_revision(self, new_revision):
 
1078
        """Template method part of set_last_revision to perform the change.
 
1079
        
 
1080
        This is used to allow WorkingTree3 instances to not affect branch
 
1081
        when their last revision is set.
 
1082
        """
 
1083
        if new_revision is None:
 
1084
            self.branch.set_revision_history([])
 
1085
            return False
 
1086
        # current format is locked in with the branch
 
1087
        revision_history = self.branch.revision_history()
 
1088
        try:
 
1089
            position = revision_history.index(new_revision)
 
1090
        except ValueError:
 
1091
            raise errors.NoSuchRevision(self.branch, new_revision)
 
1092
        self.branch.set_revision_history(revision_history[:position + 1])
 
1093
        return True
 
1094
 
 
1095
    def _cache_basis_inventory(self, new_revision):
 
1096
        """Cache new_revision as the basis inventory."""
 
1097
        try:
 
1098
            # this double handles the inventory - unpack and repack - 
 
1099
            # but is easier to understand. We can/should put a conditional
 
1100
            # in here based on whether the inventory is in the latest format
 
1101
            # - perhaps we should repack all inventories on a repository
 
1102
            # upgrade ?
 
1103
            inv = self.branch.repository.get_inventory(new_revision)
 
1104
            inv.revision_id = new_revision
 
1105
            xml = bzrlib.xml5.serializer_v5.write_inventory_to_string(inv)
 
1106
 
 
1107
            path = self._basis_inventory_name()
 
1108
            self._control_files.put_utf8(path, xml)
 
1109
        except WeaveRevisionNotPresent:
 
1110
            pass
 
1111
 
 
1112
    def read_basis_inventory(self):
 
1113
        """Read the cached basis inventory."""
 
1114
        path = self._basis_inventory_name()
 
1115
        return self._control_files.get_utf8(path).read()
 
1116
        
 
1117
    @needs_read_lock
 
1118
    def read_working_inventory(self):
 
1119
        """Read the working inventory."""
 
1120
        # ElementTree does its own conversion from UTF-8, so open in
 
1121
        # binary.
 
1122
        result = bzrlib.xml5.serializer_v5.read_inventory(
 
1123
            self._control_files.get('inventory'))
 
1124
        self._set_inventory(result)
 
1125
        return result
 
1126
 
 
1127
    @needs_write_lock
 
1128
    def remove(self, files, verbose=False):
 
1129
        """Remove nominated files from the working inventory..
 
1130
 
 
1131
        This does not remove their text.  This does not run on XXX on what? RBC
 
1132
 
 
1133
        TODO: Refuse to remove modified files unless --force is given?
 
1134
 
 
1135
        TODO: Do something useful with directories.
 
1136
 
 
1137
        TODO: Should this remove the text or not?  Tough call; not
 
1138
        removing may be useful and the user can just use use rm, and
 
1139
        is the opposite of add.  Removing it is consistent with most
 
1140
        other tools.  Maybe an option.
 
1141
        """
 
1142
        ## TODO: Normalize names
 
1143
        ## TODO: Remove nested loops; better scalability
 
1144
        if isinstance(files, basestring):
 
1145
            files = [files]
 
1146
 
 
1147
        inv = self.inventory
 
1148
 
 
1149
        # do this before any modifications
 
1150
        for f in files:
 
1151
            fid = inv.path2id(f)
 
1152
            if not fid:
 
1153
                # TODO: Perhaps make this just a warning, and continue?
 
1154
                # This tends to happen when 
 
1155
                raise NotVersionedError(path=f)
 
1156
            mutter("remove inventory entry %s {%s}", quotefn(f), fid)
 
1157
            if verbose:
 
1158
                # having remove it, it must be either ignored or unknown
 
1159
                if self.is_ignored(f):
 
1160
                    new_status = 'I'
 
1161
                else:
 
1162
                    new_status = '?'
 
1163
                show_status(new_status, inv[fid].kind, quotefn(f))
 
1164
            del inv[fid]
 
1165
 
 
1166
        self._write_inventory(inv)
 
1167
 
 
1168
    @needs_write_lock
 
1169
    def revert(self, filenames, old_tree=None, backups=True, 
 
1170
               pb=DummyProgress()):
 
1171
        from transform import revert
 
1172
        from conflicts import resolve
 
1173
        if old_tree is None:
 
1174
            old_tree = self.basis_tree()
 
1175
        conflicts = revert(self, old_tree, filenames, backups, pb)
 
1176
        if not len(filenames):
 
1177
            self.set_pending_merges([])
 
1178
            resolve(self)
 
1179
        else:
 
1180
            resolve(self, filenames, ignore_misses=True)
 
1181
        return conflicts
 
1182
 
 
1183
    # XXX: This method should be deprecated in favour of taking in a proper
 
1184
    # new Inventory object.
 
1185
    @needs_write_lock
 
1186
    def set_inventory(self, new_inventory_list):
 
1187
        from bzrlib.inventory import (Inventory,
 
1188
                                      InventoryDirectory,
 
1189
                                      InventoryEntry,
 
1190
                                      InventoryFile,
 
1191
                                      InventoryLink)
 
1192
        inv = Inventory(self.get_root_id())
 
1193
        for path, file_id, parent, kind in new_inventory_list:
 
1194
            name = os.path.basename(path)
 
1195
            if name == "":
 
1196
                continue
 
1197
            # fixme, there should be a factory function inv,add_?? 
 
1198
            if kind == 'directory':
 
1199
                inv.add(InventoryDirectory(file_id, name, parent))
 
1200
            elif kind == 'file':
 
1201
                inv.add(InventoryFile(file_id, name, parent))
 
1202
            elif kind == 'symlink':
 
1203
                inv.add(InventoryLink(file_id, name, parent))
 
1204
            else:
 
1205
                raise BzrError("unknown kind %r" % kind)
 
1206
        self._write_inventory(inv)
 
1207
 
 
1208
    @needs_write_lock
 
1209
    def set_root_id(self, file_id):
 
1210
        """Set the root id for this tree."""
 
1211
        inv = self.read_working_inventory()
 
1212
        orig_root_id = inv.root.file_id
 
1213
        del inv._byid[inv.root.file_id]
 
1214
        inv.root.file_id = file_id
 
1215
        inv._byid[inv.root.file_id] = inv.root
 
1216
        for fid in inv:
 
1217
            entry = inv[fid]
 
1218
            if entry.parent_id == orig_root_id:
 
1219
                entry.parent_id = inv.root.file_id
 
1220
        self._write_inventory(inv)
 
1221
 
 
1222
    def unlock(self):
 
1223
        """See Branch.unlock.
 
1224
        
 
1225
        WorkingTree locking just uses the Branch locking facilities.
 
1226
        This is current because all working trees have an embedded branch
 
1227
        within them. IF in the future, we were to make branch data shareable
 
1228
        between multiple working trees, i.e. via shared storage, then we 
 
1229
        would probably want to lock both the local tree, and the branch.
 
1230
        """
 
1231
        # FIXME: We want to write out the hashcache only when the last lock on
 
1232
        # this working copy is released.  Peeking at the lock count is a bit
 
1233
        # of a nasty hack; probably it's better to have a transaction object,
 
1234
        # which can do some finalization when it's either successfully or
 
1235
        # unsuccessfully completed.  (Denys's original patch did that.)
 
1236
        # RBC 20060206 hookinhg into transaction will couple lock and transaction
 
1237
        # wrongly. Hookinh into unllock on the control files object is fine though.
 
1238
        
 
1239
        # TODO: split this per format so there is no ugly if block
 
1240
        if self._hashcache.needs_write and (
 
1241
            # dedicated lock files
 
1242
            self._control_files._lock_count==1 or 
 
1243
            # shared lock files
 
1244
            (self._control_files is self.branch.control_files and 
 
1245
             self._control_files._lock_count==3)):
 
1246
            self._hashcache.write()
 
1247
        # reverse order of locking.
 
1248
        try:
 
1249
            return self._control_files.unlock()
 
1250
        finally:
 
1251
            self.branch.unlock()
 
1252
 
 
1253
    @needs_write_lock
 
1254
    def update(self):
 
1255
        """Update a working tree along its branch.
 
1256
 
 
1257
        This will update the branch if its bound too, which means we have multiple trees involved:
 
1258
        The new basis tree of the master.
 
1259
        The old basis tree of the branch.
 
1260
        The old basis tree of the working tree.
 
1261
        The current working tree state.
 
1262
        pathologically all three may be different, and non ancestors of each other.
 
1263
        Conceptually we want to:
 
1264
        Preserve the wt.basis->wt.state changes
 
1265
        Transform the wt.basis to the new master basis.
 
1266
        Apply a merge of the old branch basis to get any 'local' changes from it into the tree.
 
1267
        Restore the wt.basis->wt.state changes.
 
1268
 
 
1269
        There isn't a single operation at the moment to do that, so we:
 
1270
        Merge current state -> basis tree of the master w.r.t. the old tree basis.
 
1271
        Do a 'normal' merge of the old branch basis if it is relevant.
 
1272
        """
 
1273
        old_tip = self.branch.update()
 
1274
        if old_tip is not None:
 
1275
            self.add_pending_merge(old_tip)
 
1276
        self.branch.lock_read()
 
1277
        try:
 
1278
            result = 0
 
1279
            if self.last_revision() != self.branch.last_revision():
 
1280
                # merge tree state up to new branch tip.
 
1281
                basis = self.basis_tree()
 
1282
                to_tree = self.branch.basis_tree()
 
1283
                result += merge_inner(self.branch,
 
1284
                                      to_tree,
 
1285
                                      basis,
 
1286
                                      this_tree=self)
 
1287
                self.set_last_revision(self.branch.last_revision())
 
1288
            if old_tip and old_tip != self.last_revision():
 
1289
                # our last revision was not the prior branch last reivison
 
1290
                # and we have converted that last revision to a pending merge.
 
1291
                # base is somewhere between the branch tip now
 
1292
                # and the now pending merge
 
1293
                from bzrlib.revision import common_ancestor
 
1294
                try:
 
1295
                    base_rev_id = common_ancestor(self.branch.last_revision(),
 
1296
                                                  old_tip,
 
1297
                                                  self.branch.repository)
 
1298
                except errors.NoCommonAncestor:
 
1299
                    base_rev_id = None
 
1300
                base_tree = self.branch.repository.revision_tree(base_rev_id)
 
1301
                other_tree = self.branch.repository.revision_tree(old_tip)
 
1302
                result += merge_inner(self.branch,
 
1303
                                      other_tree,
 
1304
                                      base_tree,
 
1305
                                      this_tree=self)
 
1306
            return result
 
1307
        finally:
 
1308
            self.branch.unlock()
 
1309
 
 
1310
    @needs_write_lock
 
1311
    def _write_inventory(self, inv):
 
1312
        """Write inventory as the current inventory."""
 
1313
        sio = StringIO()
 
1314
        bzrlib.xml5.serializer_v5.write_inventory(inv, sio)
 
1315
        sio.seek(0)
 
1316
        self._control_files.put('inventory', sio)
 
1317
        self._set_inventory(inv)
 
1318
        mutter('wrote working inventory')
 
1319
 
 
1320
    def set_conflicts(self, arg):
 
1321
        raise UnsupportedOperation(self.set_conflicts, self)
 
1322
 
 
1323
    @needs_read_lock
 
1324
    def conflicts(self):
 
1325
        conflicts = ConflictList()
 
1326
        for conflicted in self._iter_conflicts():
 
1327
            text = True
 
1328
            try:
 
1329
                if file_kind(self.abspath(conflicted)) != "file":
 
1330
                    text = False
 
1331
            except OSError, e:
 
1332
                if e.errno == errno.ENOENT:
 
1333
                    text = False
 
1334
                else:
 
1335
                    raise
 
1336
            if text is True:
 
1337
                for suffix in ('.THIS', '.OTHER'):
 
1338
                    try:
 
1339
                        kind = file_kind(self.abspath(conflicted+suffix))
 
1340
                    except OSError, e:
 
1341
                        if e.errno == errno.ENOENT:
 
1342
                            text = False
 
1343
                            break
 
1344
                        else:
 
1345
                            raise
 
1346
                    if kind != "file":
 
1347
                        text = False
 
1348
                        break
 
1349
            ctype = {True: 'text conflict', False: 'contents conflict'}[text]
 
1350
            conflicts.append(Conflict.factory(ctype, path=conflicted,
 
1351
                             file_id=self.path2id(conflicted)))
 
1352
        return conflicts
 
1353
 
 
1354
 
 
1355
class WorkingTree3(WorkingTree):
 
1356
    """This is the Format 3 working tree.
 
1357
 
 
1358
    This differs from the base WorkingTree by:
 
1359
     - having its own file lock
 
1360
     - having its own last-revision property.
 
1361
 
 
1362
    This is new in bzr 0.8
 
1363
    """
 
1364
 
 
1365
    @needs_read_lock
 
1366
    def last_revision(self):
 
1367
        """See WorkingTree.last_revision."""
 
1368
        try:
 
1369
            return self._control_files.get_utf8('last-revision').read()
 
1370
        except NoSuchFile:
 
1371
            return None
 
1372
 
 
1373
    def _change_last_revision(self, revision_id):
 
1374
        """See WorkingTree._change_last_revision."""
 
1375
        if revision_id is None or revision_id == NULL_REVISION:
 
1376
            try:
 
1377
                self._control_files._transport.delete('last-revision')
 
1378
            except errors.NoSuchFile:
 
1379
                pass
 
1380
            return False
 
1381
        else:
 
1382
            try:
 
1383
                self.branch.revision_history().index(revision_id)
 
1384
            except ValueError:
 
1385
                raise errors.NoSuchRevision(self.branch, revision_id)
 
1386
            self._control_files.put_utf8('last-revision', revision_id)
 
1387
            return True
 
1388
 
 
1389
    @needs_write_lock
 
1390
    def set_conflicts(self, conflicts):
 
1391
        self._put_rio('conflicts', conflicts.to_stanzas(), 
 
1392
                      CONFLICT_HEADER_1)
 
1393
 
 
1394
    @needs_read_lock
 
1395
    def conflicts(self):
 
1396
        try:
 
1397
            confile = self._control_files.get('conflicts')
 
1398
        except NoSuchFile:
 
1399
            return ConflictList()
 
1400
        try:
 
1401
            if confile.next() != CONFLICT_HEADER_1 + '\n':
 
1402
                raise ConflictFormatError()
 
1403
        except StopIteration:
 
1404
            raise ConflictFormatError()
 
1405
        return ConflictList.from_stanzas(RioReader(confile))
 
1406
 
 
1407
 
 
1408
def get_conflicted_stem(path):
 
1409
    for suffix in CONFLICT_SUFFIXES:
 
1410
        if path.endswith(suffix):
 
1411
            return path[:-len(suffix)]
 
1412
 
 
1413
@deprecated_function(zero_eight)
 
1414
def is_control_file(filename):
 
1415
    """See WorkingTree.is_control_filename(filename)."""
 
1416
    ## FIXME: better check
 
1417
    filename = normpath(filename)
 
1418
    while filename != '':
 
1419
        head, tail = os.path.split(filename)
 
1420
        ## mutter('check %r for control file' % ((head, tail),))
 
1421
        if tail == '.bzr':
 
1422
            return True
 
1423
        if filename == head:
 
1424
            break
 
1425
        filename = head
 
1426
    return False
 
1427
 
 
1428
 
 
1429
class WorkingTreeFormat(object):
 
1430
    """An encapsulation of the initialization and open routines for a format.
 
1431
 
 
1432
    Formats provide three things:
 
1433
     * An initialization routine,
 
1434
     * a format string,
 
1435
     * an open routine.
 
1436
 
 
1437
    Formats are placed in an dict by their format string for reference 
 
1438
    during workingtree opening. Its not required that these be instances, they
 
1439
    can be classes themselves with class methods - it simply depends on 
 
1440
    whether state is needed for a given format or not.
 
1441
 
 
1442
    Once a format is deprecated, just deprecate the initialize and open
 
1443
    methods on the format class. Do not deprecate the object, as the 
 
1444
    object will be created every time regardless.
 
1445
    """
 
1446
 
 
1447
    _default_format = None
 
1448
    """The default format used for new trees."""
 
1449
 
 
1450
    _formats = {}
 
1451
    """The known formats."""
 
1452
 
 
1453
    @classmethod
 
1454
    def find_format(klass, a_bzrdir):
 
1455
        """Return the format for the working tree object in a_bzrdir."""
 
1456
        try:
 
1457
            transport = a_bzrdir.get_workingtree_transport(None)
 
1458
            format_string = transport.get("format").read()
 
1459
            return klass._formats[format_string]
 
1460
        except NoSuchFile:
 
1461
            raise errors.NoWorkingTree(base=transport.base)
 
1462
        except KeyError:
 
1463
            raise errors.UnknownFormatError(format_string)
 
1464
 
 
1465
    @classmethod
 
1466
    def get_default_format(klass):
 
1467
        """Return the current default format."""
 
1468
        return klass._default_format
 
1469
 
 
1470
    def get_format_string(self):
 
1471
        """Return the ASCII format string that identifies this format."""
 
1472
        raise NotImplementedError(self.get_format_string)
 
1473
 
 
1474
    def get_format_description(self):
 
1475
        """Return the short description for this format."""
 
1476
        raise NotImplementedError(self.get_format_description)
 
1477
 
 
1478
    def is_supported(self):
 
1479
        """Is this format supported?
 
1480
 
 
1481
        Supported formats can be initialized and opened.
 
1482
        Unsupported formats may not support initialization or committing or 
 
1483
        some other features depending on the reason for not being supported.
 
1484
        """
 
1485
        return True
 
1486
 
 
1487
    @classmethod
 
1488
    def register_format(klass, format):
 
1489
        klass._formats[format.get_format_string()] = format
 
1490
 
 
1491
    @classmethod
 
1492
    def set_default_format(klass, format):
 
1493
        klass._default_format = format
 
1494
 
 
1495
    @classmethod
 
1496
    def unregister_format(klass, format):
 
1497
        assert klass._formats[format.get_format_string()] is format
 
1498
        del klass._formats[format.get_format_string()]
 
1499
 
 
1500
 
 
1501
 
 
1502
class WorkingTreeFormat2(WorkingTreeFormat):
 
1503
    """The second working tree format. 
 
1504
 
 
1505
    This format modified the hash cache from the format 1 hash cache.
 
1506
    """
 
1507
 
 
1508
    def get_format_description(self):
 
1509
        """See WorkingTreeFormat.get_format_description()."""
 
1510
        return "Working tree format 2"
 
1511
 
 
1512
    def stub_initialize_remote(self, control_files):
 
1513
        """As a special workaround create critical control files for a remote working tree
 
1514
        
 
1515
        This ensures that it can later be updated and dealt with locally,
 
1516
        since BzrDirFormat6 and BzrDirFormat5 cannot represent dirs with 
 
1517
        no working tree.  (See bug #43064).
 
1518
        """
 
1519
        sio = StringIO()
 
1520
        inv = Inventory()
 
1521
        bzrlib.xml5.serializer_v5.write_inventory(inv, sio)
 
1522
        sio.seek(0)
 
1523
        control_files.put('inventory', sio)
 
1524
 
 
1525
        control_files.put_utf8('pending-merges', '')
 
1526
        
 
1527
 
 
1528
    def initialize(self, a_bzrdir, revision_id=None):
 
1529
        """See WorkingTreeFormat.initialize()."""
 
1530
        if not isinstance(a_bzrdir.transport, LocalTransport):
 
1531
            raise errors.NotLocalUrl(a_bzrdir.transport.base)
 
1532
        branch = a_bzrdir.open_branch()
 
1533
        if revision_id is not None:
 
1534
            branch.lock_write()
 
1535
            try:
 
1536
                revision_history = branch.revision_history()
 
1537
                try:
 
1538
                    position = revision_history.index(revision_id)
 
1539
                except ValueError:
 
1540
                    raise errors.NoSuchRevision(branch, revision_id)
 
1541
                branch.set_revision_history(revision_history[:position + 1])
 
1542
            finally:
 
1543
                branch.unlock()
 
1544
        revision = branch.last_revision()
 
1545
        inv = Inventory() 
 
1546
        wt = WorkingTree(a_bzrdir.root_transport.base,
 
1547
                         branch,
 
1548
                         inv,
 
1549
                         _internal=True,
 
1550
                         _format=self,
 
1551
                         _bzrdir=a_bzrdir)
 
1552
        wt._write_inventory(inv)
 
1553
        wt.set_root_id(inv.root.file_id)
 
1554
        wt.set_last_revision(revision)
 
1555
        wt.set_pending_merges([])
 
1556
        build_tree(wt.basis_tree(), wt)
 
1557
        return wt
 
1558
 
 
1559
    def __init__(self):
 
1560
        super(WorkingTreeFormat2, self).__init__()
 
1561
        self._matchingbzrdir = bzrdir.BzrDirFormat6()
 
1562
 
 
1563
    def open(self, a_bzrdir, _found=False):
 
1564
        """Return the WorkingTree object for a_bzrdir
 
1565
 
 
1566
        _found is a private parameter, do not use it. It is used to indicate
 
1567
               if format probing has already been done.
 
1568
        """
 
1569
        if not _found:
 
1570
            # we are being called directly and must probe.
 
1571
            raise NotImplementedError
 
1572
        if not isinstance(a_bzrdir.transport, LocalTransport):
 
1573
            raise errors.NotLocalUrl(a_bzrdir.transport.base)
 
1574
        return WorkingTree(a_bzrdir.root_transport.base,
 
1575
                           _internal=True,
 
1576
                           _format=self,
 
1577
                           _bzrdir=a_bzrdir)
 
1578
 
 
1579
 
 
1580
class WorkingTreeFormat3(WorkingTreeFormat):
 
1581
    """The second working tree format updated to record a format marker.
 
1582
 
 
1583
    This format:
 
1584
        - exists within a metadir controlling .bzr
 
1585
        - includes an explicit version marker for the workingtree control
 
1586
          files, separate from the BzrDir format
 
1587
        - modifies the hash cache format
 
1588
        - is new in bzr 0.8
 
1589
        - uses a LockDir to guard access to the repository
 
1590
    """
 
1591
 
 
1592
    def get_format_string(self):
 
1593
        """See WorkingTreeFormat.get_format_string()."""
 
1594
        return "Bazaar-NG Working Tree format 3"
 
1595
 
 
1596
    def get_format_description(self):
 
1597
        """See WorkingTreeFormat.get_format_description()."""
 
1598
        return "Working tree format 3"
 
1599
 
 
1600
    _lock_file_name = 'lock'
 
1601
    _lock_class = LockDir
 
1602
 
 
1603
    def _open_control_files(self, a_bzrdir):
 
1604
        transport = a_bzrdir.get_workingtree_transport(None)
 
1605
        return LockableFiles(transport, self._lock_file_name, 
 
1606
                             self._lock_class)
 
1607
 
 
1608
    def initialize(self, a_bzrdir, revision_id=None):
 
1609
        """See WorkingTreeFormat.initialize().
 
1610
        
 
1611
        revision_id allows creating a working tree at a differnet
 
1612
        revision than the branch is at.
 
1613
        """
 
1614
        if not isinstance(a_bzrdir.transport, LocalTransport):
 
1615
            raise errors.NotLocalUrl(a_bzrdir.transport.base)
 
1616
        transport = a_bzrdir.get_workingtree_transport(self)
 
1617
        control_files = self._open_control_files(a_bzrdir)
 
1618
        control_files.create_lock()
 
1619
        control_files.lock_write()
 
1620
        control_files.put_utf8('format', self.get_format_string())
 
1621
        branch = a_bzrdir.open_branch()
 
1622
        if revision_id is None:
 
1623
            revision_id = branch.last_revision()
 
1624
        inv = Inventory() 
 
1625
        wt = WorkingTree3(a_bzrdir.root_transport.base,
 
1626
                         branch,
 
1627
                         inv,
 
1628
                         _internal=True,
 
1629
                         _format=self,
 
1630
                         _bzrdir=a_bzrdir,
 
1631
                         _control_files=control_files)
 
1632
        wt.lock_write()
 
1633
        try:
 
1634
            wt._write_inventory(inv)
 
1635
            wt.set_root_id(inv.root.file_id)
 
1636
            wt.set_last_revision(revision_id)
 
1637
            wt.set_pending_merges([])
 
1638
            build_tree(wt.basis_tree(), wt)
 
1639
        finally:
 
1640
            wt.unlock()
 
1641
            control_files.unlock()
 
1642
        return wt
 
1643
 
 
1644
    def __init__(self):
 
1645
        super(WorkingTreeFormat3, self).__init__()
 
1646
        self._matchingbzrdir = bzrdir.BzrDirMetaFormat1()
 
1647
 
 
1648
    def open(self, a_bzrdir, _found=False):
 
1649
        """Return the WorkingTree object for a_bzrdir
 
1650
 
 
1651
        _found is a private parameter, do not use it. It is used to indicate
 
1652
               if format probing has already been done.
 
1653
        """
 
1654
        if not _found:
 
1655
            # we are being called directly and must probe.
 
1656
            raise NotImplementedError
 
1657
        if not isinstance(a_bzrdir.transport, LocalTransport):
 
1658
            raise errors.NotLocalUrl(a_bzrdir.transport.base)
 
1659
        control_files = self._open_control_files(a_bzrdir)
 
1660
        return WorkingTree3(a_bzrdir.root_transport.base,
 
1661
                           _internal=True,
 
1662
                           _format=self,
 
1663
                           _bzrdir=a_bzrdir,
 
1664
                           _control_files=control_files)
 
1665
 
 
1666
    def __str__(self):
 
1667
        return self.get_format_string()
 
1668
 
 
1669
 
 
1670
# formats which have no format string are not discoverable
 
1671
# and not independently creatable, so are not registered.
 
1672
__default_format = WorkingTreeFormat3()
 
1673
WorkingTreeFormat.register_format(__default_format)
 
1674
WorkingTreeFormat.set_default_format(__default_format)
 
1675
_legacy_formats = [WorkingTreeFormat2(),
 
1676
                   ]
 
1677
 
 
1678
 
 
1679
class WorkingTreeTestProviderAdapter(object):
 
1680
    """A tool to generate a suite testing multiple workingtree formats at once.
 
1681
 
 
1682
    This is done by copying the test once for each transport and injecting
 
1683
    the transport_server, transport_readonly_server, and workingtree_format
 
1684
    classes into each copy. Each copy is also given a new id() to make it
 
1685
    easy to identify.
 
1686
    """
 
1687
 
 
1688
    def __init__(self, transport_server, transport_readonly_server, formats):
 
1689
        self._transport_server = transport_server
 
1690
        self._transport_readonly_server = transport_readonly_server
 
1691
        self._formats = formats
 
1692
    
 
1693
    def adapt(self, test):
 
1694
        from bzrlib.tests import TestSuite
 
1695
        result = TestSuite()
 
1696
        for workingtree_format, bzrdir_format in self._formats:
 
1697
            new_test = deepcopy(test)
 
1698
            new_test.transport_server = self._transport_server
 
1699
            new_test.transport_readonly_server = self._transport_readonly_server
 
1700
            new_test.bzrdir_format = bzrdir_format
 
1701
            new_test.workingtree_format = workingtree_format
 
1702
            def make_new_test_id():
 
1703
                new_id = "%s(%s)" % (new_test.id(), workingtree_format.__class__.__name__)
 
1704
                return lambda: new_id
 
1705
            new_test.id = make_new_test_id()
 
1706
            result.addTest(new_test)
 
1707
        return result