/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/mutabletree.py

  • Committer: Ian Clatworthy
  • Date: 2008-04-17 08:21:14 UTC
  • mto: (4171.1.1 ianc-integration)
  • mto: This revision was merged to the branch mainline in revision 4173.
  • Revision ID: ian.clatworthy@canonical.com-20080417082114-76imbiarcbj16ov3
first cut at working tree content filtering

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2010 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""MutableTree object.
18
18
 
23
23
from bzrlib.lazy_import import lazy_import
24
24
lazy_import(globals(), """
25
25
import os
26
 
import re
27
26
 
28
27
from bzrlib import (
29
28
    add,
30
29
    bzrdir,
 
30
    hooks,
 
31
    )
 
32
from bzrlib.osutils import dirname
 
33
from bzrlib.revisiontree import RevisionTree
 
34
from bzrlib.trace import mutter, warning
 
35
""")
 
36
 
 
37
from bzrlib import (
31
38
    errors,
32
 
    hooks,
33
39
    osutils,
34
 
    revisiontree,
35
 
    symbol_versioning,
36
 
    trace,
37
40
    tree,
38
41
    )
39
 
""")
40
 
 
41
42
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
43
from bzrlib.osutils import splitpath
 
44
from bzrlib.symbol_versioning import DEPRECATED_PARAMETER
42
45
 
43
46
 
44
47
def needs_tree_write_lock(unbound):
66
69
    entirely in memory.
67
70
 
68
71
    For now, we are not treating MutableTree as an interface to provide
69
 
    conformance tests for - rather we are testing MemoryTree specifically, and
 
72
    conformance tests for - rather we are testing MemoryTree specifically, and 
70
73
    interface testing implementations of WorkingTree.
71
74
 
72
75
    A mutable tree always has an associated Branch and BzrDir object - the
73
76
    branch and bzrdir attributes.
74
77
    """
75
 
    def __init__(self, *args, **kw):
76
 
        super(MutableTree, self).__init__(*args, **kw)
77
 
        # Is this tree on a case-insensitive or case-preserving file-system?
78
 
        # Sub-classes may initialize to False if they detect they are being
79
 
        # used on media which doesn't differentiate the case of names.
80
 
        self.case_sensitive = True
81
78
 
82
79
    @needs_tree_write_lock
83
80
    def add(self, files, ids=None, kinds=None):
99
96
        TODO: Perhaps callback with the ids and paths as they're added.
100
97
        """
101
98
        if isinstance(files, basestring):
102
 
            # XXX: Passing a single string is inconsistent and should be
103
 
            # deprecated.
104
 
            if not (ids is None or isinstance(ids, basestring)):
105
 
                raise AssertionError()
106
 
            if not (kinds is None or isinstance(kinds, basestring)):
107
 
                raise AssertionError()
 
99
            assert(ids is None or isinstance(ids, basestring))
 
100
            assert(kinds is None or isinstance(kinds, basestring))
108
101
            files = [files]
109
102
            if ids is not None:
110
103
                ids = [ids]
116
109
        if ids is None:
117
110
            ids = [None] * len(files)
118
111
        else:
119
 
            if not (len(ids) == len(files)):
120
 
                raise AssertionError()
 
112
            assert(len(ids) == len(files))
121
113
        if kinds is None:
122
114
            kinds = [None] * len(files)
123
 
        elif not len(kinds) == len(files):
124
 
            raise AssertionError()
 
115
        else:
 
116
            assert(len(kinds) == len(files))
125
117
        for f in files:
126
118
            # generic constraint checks:
127
119
            if self.is_control_filename(f):
128
120
                raise errors.ForbiddenControlFileError(filename=f)
129
 
            fp = osutils.splitpath(f)
130
 
        # fill out file kinds for all files [not needed when we stop
 
121
            fp = splitpath(f)
 
122
        # fill out file kinds for all files [not needed when we stop 
131
123
        # caring about the instantaneous file kind within a uncommmitted tree
132
124
        #
133
125
        self._gather_kinds(files, kinds)
182
174
               **kwargs):
183
175
        # avoid circular imports
184
176
        from bzrlib import commit
185
 
        possible_master_transports=[]
186
 
        revprops = commit.Commit.update_revprops(
187
 
                revprops,
188
 
                self.branch,
189
 
                kwargs.pop('authors', None),
190
 
                kwargs.pop('author', None),
191
 
                kwargs.get('local', False),
192
 
                possible_master_transports)
 
177
        if revprops is None:
 
178
            revprops = {}
 
179
        if not 'branch-nick' in revprops:
 
180
            revprops['branch-nick'] = self.branch.nick
 
181
        author = kwargs.pop('author', None)
 
182
        if author is not None:
 
183
            assert 'author' not in revprops
 
184
            revprops['author'] = author
193
185
        # args for wt.commit start at message from the Commit.commit method,
194
186
        args = (message, ) + args
195
187
        for hook in MutableTree.hooks['start_commit']:
196
188
            hook(self)
197
189
        committed_id = commit.Commit().commit(working_tree=self,
198
 
            revprops=revprops,
199
 
            possible_master_transports=possible_master_transports,
200
 
            *args, **kwargs)
201
 
        post_hook_params = PostCommitHookParams(self)
202
 
        for hook in MutableTree.hooks['post_commit']:
203
 
            hook(post_hook_params)
 
190
            revprops=revprops, *args, **kwargs)
204
191
        return committed_id
205
192
 
206
193
    def _gather_kinds(self, files, kinds):
208
195
        raise NotImplementedError(self._gather_kinds)
209
196
 
210
197
    @needs_read_lock
211
 
    def has_changes(self, _from_tree=None):
212
 
        """Quickly check that the tree contains at least one commitable change.
213
 
 
214
 
        :param _from_tree: tree to compare against to find changes (default to
215
 
            the basis tree and is intended to be used by tests).
216
 
 
217
 
        :return: True if a change is found. False otherwise
218
 
        """
219
 
        # Check pending merges
220
 
        if len(self.get_parent_ids()) > 1:
221
 
            return True
222
 
        if _from_tree is None:
223
 
            _from_tree = self.basis_tree()
224
 
        changes = self.iter_changes(_from_tree)
225
 
        try:
226
 
            change = changes.next()
227
 
            # Exclude root (talk about black magic... --vila 20090629)
228
 
            if change[4] == (None, None):
229
 
                change = changes.next()
230
 
            return True
231
 
        except StopIteration:
232
 
            # No changes
233
 
            return False
234
 
 
235
 
    @needs_read_lock
236
 
    def check_changed_or_out_of_date(self, strict, opt_name,
237
 
                                     more_error, more_warning):
238
 
        """Check the tree for uncommitted changes and branch synchronization.
239
 
 
240
 
        If strict is None and not set in the config files, a warning is issued.
241
 
        If strict is True, an error is raised.
242
 
        If strict is False, no checks are done and no warning is issued.
243
 
 
244
 
        :param strict: True, False or None, searched in branch config if None.
245
 
 
246
 
        :param opt_name: strict option name to search in config file.
247
 
 
248
 
        :param more_error: Details about how to avoid the check.
249
 
 
250
 
        :param more_warning: Details about what is happening.
251
 
        """
252
 
        if strict is None:
253
 
            strict = self.branch.get_config().get_user_option_as_bool(opt_name)
254
 
        if strict is not False:
255
 
            err_class = None
256
 
            if (self.has_changes()):
257
 
                err_class = errors.UncommittedChanges
258
 
            elif self.last_revision() != self.branch.last_revision():
259
 
                # The tree has lost sync with its branch, there is little
260
 
                # chance that the user is aware of it but he can still force
261
 
                # the action with --no-strict
262
 
                err_class = errors.OutOfDateTree
263
 
            if err_class is not None:
264
 
                if strict is None:
265
 
                    err = err_class(self, more=more_warning)
266
 
                    # We don't want to interrupt the user if he expressed no
267
 
                    # preference about strict.
268
 
                    trace.warning('%s', err._format())
269
 
                else:
270
 
                    err = err_class(self, more=more_error)
271
 
                    raise err
272
 
 
273
 
    @needs_read_lock
274
198
    def last_revision(self):
275
199
        """Return the revision id of the last commit performed in this tree.
276
200
 
277
201
        In early tree formats the result of last_revision is the same as the
278
202
        branch last_revision, but that is no longer the case for modern tree
279
203
        formats.
280
 
 
 
204
        
281
205
        last_revision returns the left most parent id, or None if there are no
282
206
        parents.
283
207
 
300
224
    def lock_write(self):
301
225
        """Lock the tree and its branch. This allows mutating calls to be made.
302
226
 
303
 
        Some mutating methods will take out implicit write locks, but in
 
227
        Some mutating methods will take out implicit write locks, but in 
304
228
        general you should always obtain a write lock before calling mutating
305
229
        methods on a tree.
306
230
        """
316
240
        """
317
241
        raise NotImplementedError(self.mkdir)
318
242
 
319
 
    def _observed_sha1(self, file_id, path, (sha1, stat_value)):
320
 
        """Tell the tree we have observed a paths sha1.
321
 
 
322
 
        The intent of this function is to allow trees that have a hashcache to
323
 
        update the hashcache during commit. If the observed file is too new
324
 
        (based on the stat_value) to be safely hash-cached the tree will ignore
325
 
        it.
326
 
 
327
 
        The default implementation does nothing.
328
 
 
329
 
        :param file_id: The file id
330
 
        :param path: The file path
331
 
        :param sha1: The sha 1 that was observed.
332
 
        :param stat_value: A stat result for the file the sha1 was read from.
333
 
        :return: None
334
 
        """
335
 
 
336
 
    def _fix_case_of_inventory_path(self, path):
337
 
        """If our tree isn't case sensitive, return the canonical path"""
338
 
        if not self.case_sensitive:
339
 
            path = self.get_canonical_inventory_path(path)
340
 
        return path
341
 
 
342
 
    @needs_write_lock
343
 
    def put_file_bytes_non_atomic(self, file_id, bytes):
344
 
        """Update the content of a file in the tree.
345
 
 
346
 
        Note that the file is written in-place rather than being
347
 
        written to a temporary location and renamed. As a consequence,
348
 
        readers can potentially see the file half-written.
349
 
 
350
 
        :param file_id: file-id of the file
351
 
        :param bytes: the new file contents
352
 
        """
353
 
        raise NotImplementedError(self.put_file_bytes_non_atomic)
354
 
 
355
243
    def set_parent_ids(self, revision_ids, allow_leftmost_as_ghost=False):
356
244
        """Set the parents ids of the working tree.
357
245
 
362
250
    def set_parent_trees(self, parents_list, allow_leftmost_as_ghost=False):
363
251
        """Set the parents of the working tree.
364
252
 
365
 
        :param parents_list: A list of (revision_id, tree) tuples.
 
253
        :param parents_list: A list of (revision_id, tree) tuples. 
366
254
            If tree is None, then that element is treated as an unreachable
367
255
            parent tree - i.e. a ghost.
368
256
        """
376
264
        For the specific behaviour see the help for cmd_add().
377
265
 
378
266
        :param action: A reporter to be called with the inventory, parent_ie,
379
 
            path and kind of the path being added. It may return a file_id if
 
267
            path and kind of the path being added. It may return a file_id if 
380
268
            a specific one should be used.
381
269
        :param save: Save the inventory after completing the adds. If False
382
270
            this provides dry-run functionality by doing the add and not saving
388
276
        # not in an inner loop; and we want to remove direct use of this,
389
277
        # so here as a reminder for now. RBC 20070703
390
278
        from bzrlib.inventory import InventoryEntry
 
279
        assert isinstance(recurse, bool)
391
280
        if action is None:
392
281
            action = add.AddAction()
393
 
 
 
282
        
394
283
        if not file_list:
395
284
            # no paths supplied: add the entire tree.
396
 
            # FIXME: this assumes we are running in a working tree subdir :-/
397
 
            # -- vila 20100208
398
285
            file_list = [u'.']
399
286
        # mutter("smart add of %r")
400
287
        inv = self.inventory
402
289
        ignored = {}
403
290
        dirs_to_add = []
404
291
        user_dirs = set()
405
 
        conflicts_related = set()
406
 
        # Not all mutable trees can have conflicts
407
 
        if getattr(self, 'conflicts', None) is not None:
408
 
            # Collect all related files without checking whether they exist or
409
 
            # are versioned. It's cheaper to do that once for all conflicts
410
 
            # than trying to find the relevant conflict for each added file.
411
 
            for c in self.conflicts():
412
 
                conflicts_related.update(c.associated_filenames())
413
292
 
414
 
        # validate user file paths and convert all paths to tree
 
293
        # validate user file paths and convert all paths to tree 
415
294
        # relative : it's cheaper to make a tree relative path an abspath
416
 
        # than to convert an abspath to tree relative, and it's cheaper to
417
 
        # perform the canonicalization in bulk.
418
 
        for filepath in osutils.canonical_relpaths(self.basedir, file_list):
419
 
            rf = _FastPath(filepath)
420
 
            # validate user parameters. Our recursive code avoids adding new
421
 
            # files that need such validation
 
295
        # than to convert an abspath to tree relative.
 
296
        for filepath in file_list:
 
297
            rf = _FastPath(self.relpath(filepath))
 
298
            # validate user parameters. Our recursive code avoids adding new files
 
299
            # that need such validation 
422
300
            if self.is_control_filename(rf.raw_path):
423
301
                raise errors.ForbiddenControlFileError(filename=rf.raw_path)
424
 
 
 
302
            
425
303
            abspath = self.abspath(rf.raw_path)
426
304
            kind = osutils.file_kind(abspath)
427
305
            if kind == 'directory':
430
308
            else:
431
309
                if not InventoryEntry.versionable_kind(kind):
432
310
                    raise errors.BadFileKindError(filename=abspath, kind=kind)
433
 
            # ensure the named path is added, so that ignore rules in the later
434
 
            # directory walk dont skip it.
435
 
            # we dont have a parent ie known yet.: use the relatively slower
436
 
            # inventory probing method
 
311
            # ensure the named path is added, so that ignore rules in the later directory
 
312
            # walk dont skip it.
 
313
            # we dont have a parent ie known yet.: use the relatively slower inventory 
 
314
            # probing method
437
315
            versioned = inv.has_filename(rf.raw_path)
438
316
            if versioned:
439
317
                continue
455
333
                dirs_to_add.append((path, None))
456
334
            prev_dir = path.raw_path
457
335
 
458
 
        illegalpath_re = re.compile(r'[\r\n]')
459
336
        # dirs_to_add is initialised to a list of directories, but as we scan
460
337
        # directories we append files to it.
461
338
        # XXX: We should determine kind of files when we scan them rather than
470
347
            kind = osutils.file_kind(abspath)
471
348
 
472
349
            if not InventoryEntry.versionable_kind(kind):
473
 
                trace.warning("skipping %s (can't add file of kind '%s')",
474
 
                              abspath, kind)
475
 
                continue
476
 
            if illegalpath_re.search(directory.raw_path):
477
 
                trace.warning("skipping %r (contains \\n or \\r)" % abspath)
478
 
                continue
479
 
            if directory.raw_path in conflicts_related:
480
 
                # If the file looks like one generated for a conflict, don't
481
 
                # add it.
482
 
                trace.warning(
483
 
                    'skipping %s (generated to help resolve conflicts)',
484
 
                    abspath)
 
350
                warning("skipping %s (can't add file of kind '%s')", abspath, kind)
485
351
                continue
486
352
 
487
353
            if parent_ie is not None:
488
354
                versioned = directory.base_path in parent_ie.children
489
355
            else:
490
 
                # without the parent ie, use the relatively slower inventory
 
356
                # without the parent ie, use the relatively slower inventory 
491
357
                # probing method
492
 
                versioned = inv.has_filename(
493
 
                        self._fix_case_of_inventory_path(directory.raw_path))
 
358
                versioned = inv.has_filename(directory.raw_path)
494
359
 
495
360
            if kind == 'directory':
496
361
                try:
510
375
                pass
511
376
                # mutter("%r is already versioned", abspath)
512
377
            elif sub_tree:
513
 
                # XXX: This is wrong; people *might* reasonably be trying to
514
 
                # add subtrees as subtrees.  This should probably only be done
515
 
                # in formats which can represent subtrees, and even then
516
 
                # perhaps only when the user asked to add subtrees.  At the
517
 
                # moment you can add them specially through 'join --reference',
518
 
                # which is perhaps reasonable: adding a new reference is a
519
 
                # special operation and can have a special behaviour.  mbp
520
 
                # 20070306
521
 
                trace.mutter("%r is a nested bzr tree", abspath)
 
378
                # XXX: This is wrong; people *might* reasonably be trying to add
 
379
                # subtrees as subtrees.  This should probably only be done in formats 
 
380
                # which can represent subtrees, and even then perhaps only when
 
381
                # the user asked to add subtrees.  At the moment you can add them
 
382
                # specially through 'join --reference', which is perhaps
 
383
                # reasonable: adding a new reference is a special operation and
 
384
                # can have a special behaviour.  mbp 20070306
 
385
                mutter("%r is a nested bzr tree", abspath)
522
386
            else:
523
387
                _add_one(self, inv, parent_ie, directory, kind, action)
524
388
                added.append(directory.raw_path)
528
392
                    # must be present:
529
393
                    this_ie = parent_ie.children[directory.base_path]
530
394
                else:
531
 
                    # without the parent ie, use the relatively slower inventory
 
395
                    # without the parent ie, use the relatively slower inventory 
532
396
                    # probing method
533
 
                    this_id = inv.path2id(
534
 
                        self._fix_case_of_inventory_path(directory.raw_path))
 
397
                    this_id = inv.path2id(directory.raw_path)
535
398
                    if this_id is None:
536
399
                        this_ie = None
537
400
                    else:
538
401
                        this_ie = inv[this_id]
539
402
 
540
403
                for subf in sorted(os.listdir(abspath)):
541
 
                    # here we could use TreeDirectory rather than
 
404
                    # here we could use TreeDirectory rather than 
542
405
                    # string concatenation.
543
406
                    subp = osutils.pathjoin(directory.raw_path, subf)
544
 
                    # TODO: is_control_filename is very slow. Make it faster.
545
 
                    # TreeDirectory.is_control_filename could also make this
546
 
                    # faster - its impossible for a non root dir to have a
 
407
                    # TODO: is_control_filename is very slow. Make it faster. 
 
408
                    # TreeDirectory.is_control_filename could also make this 
 
409
                    # faster - its impossible for a non root dir to have a 
547
410
                    # control file.
548
411
                    if self.is_control_filename(subp):
549
 
                        trace.mutter("skip control directory %r", subp)
 
412
                        mutter("skip control directory %r", subp)
550
413
                    elif subf in this_ie.children:
551
414
                        # recurse into this already versioned subdir.
552
415
                        dirs_to_add.append((_FastPath(subp, subf), this_ie))
584
447
        for commit which is not required to handle situations that do not arise
585
448
        outside of commit.
586
449
 
587
 
        See the inventory developers documentation for the theory behind
588
 
        inventory deltas.
589
 
 
590
450
        :param new_revid: The new revision id for the trees parent.
591
451
        :param delta: An inventory delta (see apply_inventory_delta) describing
592
452
            the changes from the current left most parent revision to new_revid.
602
462
        # WorkingTree classes for optimised versions for specific format trees.
603
463
        basis = self.basis_tree()
604
464
        basis.lock_read()
605
 
        # TODO: Consider re-evaluating the need for this with CHKInventory
606
 
        # we don't strictly need to mutate an inventory for this
607
 
        # it only makes sense when apply_delta is cheaper than get_inventory()
608
 
        inventory = basis.inventory._get_mutable_inventory()
 
465
        inventory = basis.inventory
609
466
        basis.unlock()
610
467
        inventory.apply_delta(delta)
611
 
        rev_tree = revisiontree.RevisionTree(self.branch.repository,
612
 
                                             inventory, new_revid)
 
468
        rev_tree = RevisionTree(self.branch.repository, inventory, new_revid)
613
469
        self.set_parent_trees([(new_revid, rev_tree)])
614
470
 
615
471
 
616
472
class MutableTreeHooks(hooks.Hooks):
617
 
    """A dictionary mapping a hook name to a list of callables for mutabletree
 
473
    """A dictionary mapping a hook name to a list of callables for mutabletree 
618
474
    hooks.
619
475
    """
620
476
 
623
479
 
624
480
        """
625
481
        hooks.Hooks.__init__(self)
626
 
        self.create_hook(hooks.HookPoint('start_commit',
627
 
            "Called before a commit is performed on a tree. The start commit "
628
 
            "hook is able to change the tree before the commit takes place. "
629
 
            "start_commit is called with the bzrlib.mutabletree.MutableTree "
630
 
            "that the commit is being performed on.", (1, 4), None))
631
 
        self.create_hook(hooks.HookPoint('post_commit',
632
 
            "Called after a commit is performed on a tree. The hook is "
633
 
            "called with a bzrlib.mutabletree.PostCommitHookParams object. "
634
 
            "The mutable tree the commit was performed on is available via "
635
 
            "the mutable_tree attribute of that object.", (2, 0), None))
 
482
        # Invoked before a commit is done in a tree. New in 1.4
 
483
        self['start_commit'] = []
636
484
 
637
485
 
638
486
# install the default hooks into the MutableTree class.
639
487
MutableTree.hooks = MutableTreeHooks()
640
488
 
641
489
 
642
 
class PostCommitHookParams(object):
643
 
    """Parameters for the post_commit hook.
644
 
 
645
 
    To access the parameters, use the following attributes:
646
 
 
647
 
    * mutable_tree - the MutableTree object
648
 
    """
649
 
 
650
 
    def __init__(self, mutable_tree):
651
 
        """Create the parameters for the post_commit hook."""
652
 
        self.mutable_tree = mutable_tree
653
 
 
654
 
 
655
490
class _FastPath(object):
656
491
    """A path object with fast accessors for things like basename."""
657
492
 
691
526
        added = []
692
527
    else:
693
528
        # slower but does not need parent_ie
694
 
        if inv.has_filename(tree._fix_case_of_inventory_path(path.raw_path)):
 
529
        if inv.has_filename(path.raw_path):
695
530
            return []
696
531
        # its really not there : add the parent
697
532
        # note that the dirname use leads to some extra str copying etc but as
698
533
        # there are a limited number of dirs we can be nested under, it should
699
534
        # generally find it very fast and not recurse after that.
700
535
        added = _add_one_and_parent(tree, inv, None,
701
 
            _FastPath(osutils.dirname(path.raw_path)), 'directory', action)
702
 
        parent_id = inv.path2id(osutils.dirname(path.raw_path))
 
536
            _FastPath(dirname(path.raw_path)), 'directory', action)
 
537
        parent_id = inv.path2id(dirname(path.raw_path))
703
538
        parent_ie = inv[parent_id]
704
539
    _add_one(tree, inv, parent_ie, path, kind, action)
705
540
    return added + [path.raw_path]