/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/tree.py

  • Committer: Robert Collins
  • Date: 2010-05-06 11:08:10 UTC
  • mto: This revision was merged to the branch mainline in revision 5223.
  • Revision ID: robertc@robertcollins.net-20100506110810-h3j07fh5gmw54s25
Cleaner matcher matching revised unlocking protocol.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005-2011 Canonical Ltd
 
1
# Copyright (C) 2005-2010 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
18
18
"""
19
19
 
20
20
import os
21
 
 
22
 
from bzrlib.lazy_import import lazy_import
23
 
lazy_import(globals(), """
24
 
import collections
25
 
 
 
21
from collections import deque
 
22
 
 
23
import bzrlib
26
24
from bzrlib import (
27
25
    conflicts as _mod_conflicts,
28
26
    debug,
29
27
    delta,
30
 
    errors,
31
28
    filters,
32
 
    inventory,
33
29
    osutils,
34
30
    revision as _mod_revision,
35
31
    rules,
36
 
    trace,
37
32
    )
38
 
""")
39
 
 
40
33
from bzrlib.decorators import needs_read_lock
 
34
from bzrlib.errors import BzrError, NoSuchId
 
35
from bzrlib import errors
 
36
from bzrlib.inventory import InventoryFile
41
37
from bzrlib.inter import InterObject
42
 
from bzrlib.symbol_versioning import (
43
 
    deprecated_in,
44
 
    deprecated_method,
45
 
    )
 
38
from bzrlib.osutils import fingerprint_file
 
39
from bzrlib.symbol_versioning import deprecated_function, deprecated_in
 
40
from bzrlib.trace import note
46
41
 
47
42
 
48
43
class Tree(object):
54
49
 
55
50
    * `RevisionTree` is a tree as recorded at some point in the past.
56
51
 
 
52
    Trees contain an `Inventory` object, and also know how to retrieve
 
53
    file texts mentioned in the inventory, either from a working
 
54
    directory or from a store.
 
55
 
 
56
    It is possible for trees to contain files that are not described
 
57
    in their inventory or vice versa; for this use `filenames()`.
 
58
 
57
59
    Trees can be compared, etc, regardless of whether they are working
58
60
    trees or versioned trees.
59
61
    """
60
62
 
61
 
    def has_versioned_directories(self):
62
 
        """Whether this tree can contain explicitly versioned directories.
63
 
 
64
 
        This defaults to True, but some implementations may want to override
65
 
        it.
66
 
        """
67
 
        return True
68
 
 
69
63
    def changes_from(self, other, want_unchanged=False, specific_files=None,
70
64
        extra_trees=None, require_versioned=False, include_root=False,
71
65
        want_unversioned=False):
133
127
        raise NotImplementedError(self.has_filename)
134
128
 
135
129
    def has_id(self, file_id):
136
 
        raise NotImplementedError(self.has_id)
 
130
        return self.inventory.has_id(file_id)
137
131
 
138
 
    @deprecated_method(deprecated_in((2, 4, 0)))
139
132
    def __contains__(self, file_id):
140
133
        return self.has_id(file_id)
141
134
 
142
135
    def has_or_had_id(self, file_id):
143
 
        raise NotImplementedError(self.has_or_had_id)
 
136
        return self.inventory.has_id(file_id)
144
137
 
145
138
    def is_ignored(self, filename):
146
139
        """Check whether the filename is ignored by this tree.
150
143
        """
151
144
        return False
152
145
 
 
146
    def __iter__(self):
 
147
        return iter(self.inventory)
 
148
 
153
149
    def all_file_ids(self):
154
150
        """Iterate through all file ids, including ids for missing files."""
155
 
        raise NotImplementedError(self.all_file_ids)
 
151
        return set(self.inventory)
156
152
 
157
153
    def id2path(self, file_id):
158
154
        """Return the path for a file id.
159
155
 
160
156
        :raises NoSuchId:
161
157
        """
162
 
        raise NotImplementedError(self.id2path)
163
 
 
 
158
        return self.inventory.id2path(file_id)
 
159
 
 
160
    def is_control_filename(self, filename):
 
161
        """True if filename is the name of a control file in this tree.
 
162
 
 
163
        :param filename: A filename within the tree. This is a relative path
 
164
        from the root of this tree.
 
165
 
 
166
        This is true IF and ONLY IF the filename is part of the meta data
 
167
        that bzr controls in this tree. I.E. a random .bzr directory placed
 
168
        on disk will not be a control file for this tree.
 
169
        """
 
170
        return self.bzrdir.is_control_filename(filename)
 
171
 
 
172
    @needs_read_lock
164
173
    def iter_entries_by_dir(self, specific_file_ids=None, yield_parents=False):
165
174
        """Walk the tree in 'by_dir' order.
166
175
 
183
192
             g
184
193
 
185
194
        The yield order (ignoring root) would be::
186
 
 
187
195
          a, f, a/b, a/d, a/b/c, a/d/e, f/g
188
196
 
189
197
        :param yield_parents: If True, yield the parents from the root leading
190
198
            down to specific_file_ids that have been requested. This has no
191
199
            impact if specific_file_ids is None.
192
200
        """
193
 
        raise NotImplementedError(self.iter_entries_by_dir)
194
 
 
195
 
    def list_files(self, include_root=False, from_dir=None, recursive=True):
196
 
        """List all files in this tree.
197
 
 
198
 
        :param include_root: Whether to include the entry for the tree root
199
 
        :param from_dir: Directory under which to list files
200
 
        :param recursive: Whether to list files recursively
201
 
        :return: iterator over tuples of (path, versioned, kind, file_id,
202
 
            inventory entry)
203
 
        """
204
 
        raise NotImplementedError(self.list_files)
 
201
        return self.inventory.iter_entries_by_dir(
 
202
            specific_file_ids=specific_file_ids, yield_parents=yield_parents)
205
203
 
206
204
    def iter_references(self):
207
205
        if self.supports_tree_reference():
258
256
    def _file_size(self, entry, stat_value):
259
257
        raise NotImplementedError(self._file_size)
260
258
 
 
259
    def _get_inventory(self):
 
260
        return self._inventory
 
261
 
261
262
    def get_file(self, file_id, path=None):
262
263
        """Return a file object for the file file_id in the tree.
263
264
 
285
286
 
286
287
        :param file_id: The file_id of the file.
287
288
        :param path: The path of the file.
288
 
 
289
289
        If both file_id and path are supplied, an implementation may use
290
290
        either one.
291
 
 
292
 
        :returns: A single byte string for the whole file.
293
291
        """
294
292
        my_file = self.get_file(file_id, path)
295
293
        try:
302
300
 
303
301
        :param file_id: The file_id of the file.
304
302
        :param path: The path of the file.
305
 
 
306
303
        If both file_id and path are supplied, an implementation may use
307
304
        either one.
308
305
        """
309
306
        return osutils.split_lines(self.get_file_text(file_id, path))
310
307
 
311
 
    def get_file_verifier(self, file_id, path=None, stat_value=None):
312
 
        """Return a verifier for a file.
313
 
 
314
 
        The default implementation returns a sha1.
315
 
 
316
 
        :param file_id: The handle for this file.
317
 
        :param path: The path that this file can be found at.
318
 
            These must point to the same object.
319
 
        :param stat_value: Optional stat value for the object
320
 
        :return: Tuple with verifier name and verifier data
321
 
        """
322
 
        return ("SHA1", self.get_file_sha1(file_id, path=path,
323
 
            stat_value=stat_value))
324
 
 
325
 
    def get_file_sha1(self, file_id, path=None, stat_value=None):
326
 
        """Return the SHA1 file for a file.
327
 
 
328
 
        :note: callers should use get_file_verifier instead
329
 
            where possible, as the underlying repository implementation may
330
 
            have quicker access to a non-sha1 verifier.
331
 
 
332
 
        :param file_id: The handle for this file.
333
 
        :param path: The path that this file can be found at.
334
 
            These must point to the same object.
335
 
        :param stat_value: Optional stat value for the object
336
 
        """
337
 
        raise NotImplementedError(self.get_file_sha1)
338
 
 
339
308
    def get_file_mtime(self, file_id, path=None):
340
309
        """Return the modification time for a file.
341
310
 
355
324
        raise NotImplementedError(self.get_file_size)
356
325
 
357
326
    def get_file_by_path(self, path):
358
 
        raise NotImplementedError(self.get_file_by_path)
359
 
 
360
 
    def is_executable(self, file_id, path=None):
361
 
        """Check if a file is executable.
362
 
 
363
 
        :param file_id: The handle for this file.
364
 
        :param path: The path that this file can be found at.
365
 
            These must point to the same object.
366
 
        """
367
 
        raise NotImplementedError(self.is_executable)
 
327
        return self.get_file(self._inventory.path2id(path), path)
368
328
 
369
329
    def iter_files_bytes(self, desired_files):
370
330
        """Iterate through file contents.
392
352
            cur_file = (self.get_file_text(file_id),)
393
353
            yield identifier, cur_file
394
354
 
395
 
    def get_symlink_target(self, file_id, path=None):
 
355
    def get_symlink_target(self, file_id):
396
356
        """Get the target for a given file_id.
397
357
 
398
358
        It is assumed that the caller already knows that file_id is referencing
399
359
        a symlink.
400
360
        :param file_id: Handle for the symlink entry.
401
 
        :param path: The path of the file.
402
 
        If both file_id and path are supplied, an implementation may use
403
 
        either one.
404
361
        :return: The path the symlink points to.
405
362
        """
406
363
        raise NotImplementedError(self.get_symlink_target)
407
364
 
 
365
    def get_canonical_inventory_paths(self, paths):
 
366
        """Like get_canonical_inventory_path() but works on multiple items.
 
367
 
 
368
        :param paths: A sequence of paths relative to the root of the tree.
 
369
        :return: A list of paths, with each item the corresponding input path
 
370
        adjusted to account for existing elements that match case
 
371
        insensitively.
 
372
        """
 
373
        return list(self._yield_canonical_inventory_paths(paths))
 
374
 
 
375
    def get_canonical_inventory_path(self, path):
 
376
        """Returns the first inventory item that case-insensitively matches path.
 
377
 
 
378
        If a path matches exactly, it is returned. If no path matches exactly
 
379
        but more than one path matches case-insensitively, it is implementation
 
380
        defined which is returned.
 
381
 
 
382
        If no path matches case-insensitively, the input path is returned, but
 
383
        with as many path entries that do exist changed to their canonical
 
384
        form.
 
385
 
 
386
        If you need to resolve many names from the same tree, you should
 
387
        use get_canonical_inventory_paths() to avoid O(N) behaviour.
 
388
 
 
389
        :param path: A paths relative to the root of the tree.
 
390
        :return: The input path adjusted to account for existing elements
 
391
        that match case insensitively.
 
392
        """
 
393
        return self._yield_canonical_inventory_paths([path]).next()
 
394
 
 
395
    def _yield_canonical_inventory_paths(self, paths):
 
396
        for path in paths:
 
397
            # First, if the path as specified exists exactly, just use it.
 
398
            if self.path2id(path) is not None:
 
399
                yield path
 
400
                continue
 
401
            # go walkin...
 
402
            cur_id = self.get_root_id()
 
403
            cur_path = ''
 
404
            bit_iter = iter(path.split("/"))
 
405
            for elt in bit_iter:
 
406
                lelt = elt.lower()
 
407
                new_path = None
 
408
                for child in self.iter_children(cur_id):
 
409
                    try:
 
410
                        # XXX: it seem like if the child is known to be in the
 
411
                        # tree, we shouldn't need to go from its id back to
 
412
                        # its path -- mbp 2010-02-11
 
413
                        #
 
414
                        # XXX: it seems like we could be more efficient
 
415
                        # by just directly looking up the original name and
 
416
                        # only then searching all children; also by not
 
417
                        # chopping paths so much. -- mbp 2010-02-11
 
418
                        child_base = os.path.basename(self.id2path(child))
 
419
                        if (child_base == elt):
 
420
                            # if we found an exact match, we can stop now; if
 
421
                            # we found an approximate match we need to keep
 
422
                            # searching because there might be an exact match
 
423
                            # later.  
 
424
                            cur_id = child
 
425
                            new_path = osutils.pathjoin(cur_path, child_base)
 
426
                            break
 
427
                        elif child_base.lower() == lelt:
 
428
                            cur_id = child
 
429
                            new_path = osutils.pathjoin(cur_path, child_base)
 
430
                    except NoSuchId:
 
431
                        # before a change is committed we can see this error...
 
432
                        continue
 
433
                if new_path:
 
434
                    cur_path = new_path
 
435
                else:
 
436
                    # got to the end of this directory and no entries matched.
 
437
                    # Return what matched so far, plus the rest as specified.
 
438
                    cur_path = osutils.pathjoin(cur_path, elt, *list(bit_iter))
 
439
                    break
 
440
            yield cur_path
 
441
        # all done.
 
442
 
408
443
    def get_root_id(self):
409
444
        """Return the file_id for the root of this tree."""
410
445
        raise NotImplementedError(self.get_root_id)
468
503
            except errors.NoSuchRevisionInTree:
469
504
                yield self.repository.revision_tree(revision_id)
470
505
 
 
506
    @staticmethod
 
507
    def _file_revision(revision_tree, file_id):
 
508
        """Determine the revision associated with a file in a given tree."""
 
509
        revision_tree.lock_read()
 
510
        try:
 
511
            return revision_tree.inventory[file_id].revision
 
512
        finally:
 
513
            revision_tree.unlock()
 
514
 
471
515
    def _get_file_revision(self, file_id, vf, tree_revision):
472
516
        """Ensure that file_id, tree_revision is in vf to plan the merge."""
473
517
 
474
518
        if getattr(self, '_repository', None) is None:
475
519
            last_revision = tree_revision
476
 
            parent_keys = [(file_id, t.get_file_revision(file_id)) for t in
 
520
            parent_keys = [(file_id, self._file_revision(t, file_id)) for t in
477
521
                self._iter_parent_trees()]
478
522
            vf.add_lines((file_id, last_revision), parent_keys,
479
 
                         self.get_file_lines(file_id))
 
523
                         self.get_file(file_id).readlines())
480
524
            repo = self.branch.repository
481
525
            base_vf = repo.texts
482
526
        else:
483
 
            last_revision = self.get_file_revision(file_id)
 
527
            last_revision = self._file_revision(self, file_id)
484
528
            base_vf = self._repository.texts
485
529
        if base_vf not in vf.fallback_versionedfiles:
486
530
            vf.fallback_versionedfiles.append(base_vf)
487
531
        return last_revision
488
532
 
 
533
    inventory = property(_get_inventory,
 
534
                         doc="Inventory of this Tree")
 
535
 
489
536
    def _check_retrieved(self, ie, f):
490
537
        if not __debug__:
491
538
            return
492
 
        fp = osutils.fingerprint_file(f)
 
539
        fp = fingerprint_file(f)
493
540
        f.seek(0)
494
541
 
495
542
        if ie.text_size is not None:
496
543
            if ie.text_size != fp['size']:
497
 
                raise errors.BzrError(
498
 
                        "mismatched size for file %r in %r" %
499
 
                        (ie.file_id, self._store),
 
544
                raise BzrError("mismatched size for file %r in %r" % (ie.file_id, self._store),
500
545
                        ["inventory expects %d bytes" % ie.text_size,
501
546
                         "file is actually %d bytes" % fp['size'],
502
547
                         "store is probably damaged/corrupt"])
503
548
 
504
549
        if ie.text_sha1 != fp['sha1']:
505
 
            raise errors.BzrError("wrong SHA-1 for file %r in %r" %
506
 
                    (ie.file_id, self._store),
 
550
            raise BzrError("wrong SHA-1 for file %r in %r" % (ie.file_id, self._store),
507
551
                    ["inventory expects %s" % ie.text_sha1,
508
552
                     "file is actually %s" % fp['sha1'],
509
553
                     "store is probably damaged/corrupt"])
510
554
 
 
555
    @needs_read_lock
511
556
    def path2id(self, path):
512
557
        """Return the id for path in this tree."""
513
 
        raise NotImplementedError(self.path2id)
 
558
        return self._inventory.path2id(path)
514
559
 
515
560
    def paths2ids(self, paths, trees=[], require_versioned=True):
516
561
        """Return all the ids that can be reached by walking from paths.
537
582
            yield child.file_id
538
583
 
539
584
    def lock_read(self):
540
 
        """Lock this tree for multiple read only operations.
541
 
        
542
 
        :return: A bzrlib.lock.LogicalLockResult.
543
 
        """
544
585
        pass
545
586
 
546
587
    def revision_tree(self, revision_id):
573
614
 
574
615
        :return: set of paths.
575
616
        """
576
 
        raise NotImplementedError(self.filter_unversioned_files)
 
617
        # NB: we specifically *don't* call self.has_filename, because for
 
618
        # WorkingTrees that can indicate files that exist on disk but that
 
619
        # are not versioned.
 
620
        pred = self.inventory.has_filename
 
621
        return set((p for p in paths if not pred(p)))
577
622
 
578
623
    def walkdirs(self, prefix=""):
579
624
        """Walk the contents of this tree from path down.
631
676
        prefs = self.iter_search_rules([path], filter_pref_names).next()
632
677
        stk = filters._get_filter_stack_for(prefs)
633
678
        if 'filters' in debug.debug_flags:
634
 
            trace.note("*** %s content-filter: %s => %r" % (path,prefs,stk))
 
679
            note("*** %s content-filter: %s => %r" % (path,prefs,stk))
635
680
        return stk
636
681
 
637
682
    def _content_filter_stack_provider(self):
676
721
        return searcher
677
722
 
678
723
 
679
 
class InventoryTree(Tree):
680
 
    """A tree that relies on an inventory for its metadata.
681
 
 
682
 
    Trees contain an `Inventory` object, and also know how to retrieve
683
 
    file texts mentioned in the inventory, either from a working
684
 
    directory or from a store.
685
 
 
686
 
    It is possible for trees to contain files that are not described
687
 
    in their inventory or vice versa; for this use `filenames()`.
688
 
 
689
 
    Subclasses should set the _inventory attribute, which is considered
690
 
    private to external API users.
 
724
######################################################################
 
725
# diff
 
726
 
 
727
# TODO: Merge these two functions into a single one that can operate
 
728
# on either a whole tree or a set of files.
 
729
 
 
730
# TODO: Return the diff in order by filename, not by category or in
 
731
# random order.  Can probably be done by lock-stepping through the
 
732
# filenames from both trees.
 
733
 
 
734
 
 
735
def file_status(filename, old_tree, new_tree):
 
736
    """Return single-letter status, old and new names for a file.
 
737
 
 
738
    The complexity here is in deciding how to represent renames;
 
739
    many complex cases are possible.
691
740
    """
692
 
 
693
 
    def get_canonical_inventory_paths(self, paths):
694
 
        """Like get_canonical_inventory_path() but works on multiple items.
695
 
 
696
 
        :param paths: A sequence of paths relative to the root of the tree.
697
 
        :return: A list of paths, with each item the corresponding input path
698
 
        adjusted to account for existing elements that match case
699
 
        insensitively.
700
 
        """
701
 
        return list(self._yield_canonical_inventory_paths(paths))
702
 
 
703
 
    def get_canonical_inventory_path(self, path):
704
 
        """Returns the first inventory item that case-insensitively matches path.
705
 
 
706
 
        If a path matches exactly, it is returned. If no path matches exactly
707
 
        but more than one path matches case-insensitively, it is implementation
708
 
        defined which is returned.
709
 
 
710
 
        If no path matches case-insensitively, the input path is returned, but
711
 
        with as many path entries that do exist changed to their canonical
712
 
        form.
713
 
 
714
 
        If you need to resolve many names from the same tree, you should
715
 
        use get_canonical_inventory_paths() to avoid O(N) behaviour.
716
 
 
717
 
        :param path: A paths relative to the root of the tree.
718
 
        :return: The input path adjusted to account for existing elements
719
 
        that match case insensitively.
720
 
        """
721
 
        return self._yield_canonical_inventory_paths([path]).next()
722
 
 
723
 
    def _yield_canonical_inventory_paths(self, paths):
724
 
        for path in paths:
725
 
            # First, if the path as specified exists exactly, just use it.
726
 
            if self.path2id(path) is not None:
727
 
                yield path
728
 
                continue
729
 
            # go walkin...
730
 
            cur_id = self.get_root_id()
731
 
            cur_path = ''
732
 
            bit_iter = iter(path.split("/"))
733
 
            for elt in bit_iter:
734
 
                lelt = elt.lower()
735
 
                new_path = None
736
 
                for child in self.iter_children(cur_id):
737
 
                    try:
738
 
                        # XXX: it seem like if the child is known to be in the
739
 
                        # tree, we shouldn't need to go from its id back to
740
 
                        # its path -- mbp 2010-02-11
741
 
                        #
742
 
                        # XXX: it seems like we could be more efficient
743
 
                        # by just directly looking up the original name and
744
 
                        # only then searching all children; also by not
745
 
                        # chopping paths so much. -- mbp 2010-02-11
746
 
                        child_base = os.path.basename(self.id2path(child))
747
 
                        if (child_base == elt):
748
 
                            # if we found an exact match, we can stop now; if
749
 
                            # we found an approximate match we need to keep
750
 
                            # searching because there might be an exact match
751
 
                            # later.  
752
 
                            cur_id = child
753
 
                            new_path = osutils.pathjoin(cur_path, child_base)
754
 
                            break
755
 
                        elif child_base.lower() == lelt:
756
 
                            cur_id = child
757
 
                            new_path = osutils.pathjoin(cur_path, child_base)
758
 
                    except errors.NoSuchId:
759
 
                        # before a change is committed we can see this error...
760
 
                        continue
761
 
                if new_path:
762
 
                    cur_path = new_path
763
 
                else:
764
 
                    # got to the end of this directory and no entries matched.
765
 
                    # Return what matched so far, plus the rest as specified.
766
 
                    cur_path = osutils.pathjoin(cur_path, elt, *list(bit_iter))
767
 
                    break
768
 
            yield cur_path
769
 
        # all done.
770
 
 
771
 
    def _get_inventory(self):
772
 
        return self._inventory
773
 
 
774
 
    inventory = property(_get_inventory,
775
 
                         doc="Inventory of this Tree")
776
 
 
777
 
    @needs_read_lock
778
 
    def path2id(self, path):
779
 
        """Return the id for path in this tree."""
780
 
        return self._inventory.path2id(path)
781
 
 
782
 
    def id2path(self, file_id):
783
 
        """Return the path for a file id.
784
 
 
785
 
        :raises NoSuchId:
786
 
        """
787
 
        return self.inventory.id2path(file_id)
788
 
 
789
 
    def has_id(self, file_id):
790
 
        return self.inventory.has_id(file_id)
791
 
 
792
 
    def has_or_had_id(self, file_id):
793
 
        return self.inventory.has_id(file_id)
794
 
 
795
 
    def all_file_ids(self):
796
 
        return set(self.inventory)
797
 
 
798
 
    @deprecated_method(deprecated_in((2, 4, 0)))
799
 
    def __iter__(self):
800
 
        return iter(self.inventory)
801
 
 
802
 
    def filter_unversioned_files(self, paths):
803
 
        """Filter out paths that are versioned.
804
 
 
805
 
        :return: set of paths.
806
 
        """
807
 
        # NB: we specifically *don't* call self.has_filename, because for
808
 
        # WorkingTrees that can indicate files that exist on disk but that
809
 
        # are not versioned.
810
 
        pred = self.inventory.has_filename
811
 
        return set((p for p in paths if not pred(p)))
812
 
 
813
 
    @needs_read_lock
814
 
    def iter_entries_by_dir(self, specific_file_ids=None, yield_parents=False):
815
 
        """Walk the tree in 'by_dir' order.
816
 
 
817
 
        This will yield each entry in the tree as a (path, entry) tuple.
818
 
        The order that they are yielded is:
819
 
 
820
 
        See Tree.iter_entries_by_dir for details.
821
 
 
822
 
        :param yield_parents: If True, yield the parents from the root leading
823
 
            down to specific_file_ids that have been requested. This has no
824
 
            impact if specific_file_ids is None.
825
 
        """
826
 
        return self.inventory.iter_entries_by_dir(
827
 
            specific_file_ids=specific_file_ids, yield_parents=yield_parents)
828
 
 
829
 
    def get_file_by_path(self, path):
830
 
        return self.get_file(self._inventory.path2id(path), path)
 
741
    old_inv = old_tree.inventory
 
742
    new_inv = new_tree.inventory
 
743
    new_id = new_inv.path2id(filename)
 
744
    old_id = old_inv.path2id(filename)
 
745
 
 
746
    if not new_id and not old_id:
 
747
        # easy: doesn't exist in either; not versioned at all
 
748
        if new_tree.is_ignored(filename):
 
749
            return 'I', None, None
 
750
        else:
 
751
            return '?', None, None
 
752
    elif new_id:
 
753
        # There is now a file of this name, great.
 
754
        pass
 
755
    else:
 
756
        # There is no longer a file of this name, but we can describe
 
757
        # what happened to the file that used to have
 
758
        # this name.  There are two possibilities: either it was
 
759
        # deleted entirely, or renamed.
 
760
        if new_inv.has_id(old_id):
 
761
            return 'X', old_inv.id2path(old_id), new_inv.id2path(old_id)
 
762
        else:
 
763
            return 'D', old_inv.id2path(old_id), None
 
764
 
 
765
    # if the file_id is new in this revision, it is added
 
766
    if new_id and not old_inv.has_id(new_id):
 
767
        return 'A'
 
768
 
 
769
    # if there used to be a file of this name, but that ID has now
 
770
    # disappeared, it is deleted
 
771
    if old_id and not new_inv.has_id(old_id):
 
772
        return 'D'
 
773
 
 
774
    return 'wtf?'
 
775
 
 
776
 
 
777
@deprecated_function(deprecated_in((1, 9, 0)))
 
778
def find_renames(old_inv, new_inv):
 
779
    for file_id in old_inv:
 
780
        if file_id not in new_inv:
 
781
            continue
 
782
        old_name = old_inv.id2path(file_id)
 
783
        new_name = new_inv.id2path(file_id)
 
784
        if old_name != new_name:
 
785
            yield (old_name, new_name)
831
786
 
832
787
 
833
788
def find_ids_across_trees(filenames, trees, require_versioned=True):
840
795
        None)
841
796
    :param trees: The trees to find file_ids within
842
797
    :param require_versioned: if true, all specified filenames must occur in
843
 
        at least one tree.
 
798
    at least one tree.
844
799
    :return: a set of file ids for the specified filenames and their children.
845
800
    """
846
801
    if not filenames:
922
877
 
923
878
    _optimisers = []
924
879
 
925
 
    @classmethod
926
 
    def is_compatible(kls, source, target):
927
 
        # The default implementation is naive and uses the public API, so
928
 
        # it works for all trees.
929
 
        return True
930
 
 
931
880
    def _changes_from_entries(self, source_entry, target_entry,
932
881
        source_path=None, target_path=None):
933
882
        """Generate a iter_changes tuple between source_entry and target_entry.
981
930
        if source_kind != target_kind:
982
931
            changed_content = True
983
932
        elif source_kind == 'file':
984
 
            if not self.file_content_matches(file_id, file_id, source_path,
985
 
                    target_path, source_stat, target_stat):
 
933
            if (self.source.get_file_sha1(file_id, source_path, source_stat) !=
 
934
                self.target.get_file_sha1(file_id, target_path, target_stat)):
986
935
                changed_content = True
987
936
        elif source_kind == 'symlink':
988
937
            if (self.source.get_symlink_target(file_id) !=
1038
987
            # All files are unversioned, so just return an empty delta
1039
988
            # _compare_trees would think we want a complete delta
1040
989
            result = delta.TreeDelta()
1041
 
            fake_entry = inventory.InventoryFile('unused', 'unused', 'unused')
 
990
            fake_entry = InventoryFile('unused', 'unused', 'unused')
1042
991
            result.unversioned = [(path, None,
1043
992
                self.target._comparison_data(fake_entry, path)[0]) for path in
1044
993
                specific_files]
1109
1058
                                     self.target.extras()
1110
1059
                if specific_files is None or
1111
1060
                    osutils.is_inside_any(specific_files, p)])
1112
 
            all_unversioned = collections.deque(all_unversioned)
 
1061
            all_unversioned = deque(all_unversioned)
1113
1062
        else:
1114
 
            all_unversioned = collections.deque()
 
1063
            all_unversioned = deque()
1115
1064
        to_paths = {}
1116
1065
        from_entries_by_dir = list(self.source.iter_entries_by_dir(
1117
1066
            specific_file_ids=specific_file_ids))
1123
1072
        # the unversioned path lookup only occurs on real trees - where there
1124
1073
        # can be extras. So the fake_entry is solely used to look up
1125
1074
        # executable it values when execute is not supported.
1126
 
        fake_entry = inventory.InventoryFile('unused', 'unused', 'unused')
 
1075
        fake_entry = InventoryFile('unused', 'unused', 'unused')
1127
1076
        for target_path, target_entry in to_entries_by_dir:
1128
1077
            while (all_unversioned and
1129
1078
                all_unversioned[0][0] < target_path.split('/')):
1177
1126
            if file_id in to_paths:
1178
1127
                # already returned
1179
1128
                continue
1180
 
            if not self.target.has_id(file_id):
 
1129
            if file_id not in self.target.all_file_ids():
1181
1130
                # common case - paths we have not emitted are not present in
1182
1131
                # target.
1183
1132
                to_path = None
1301
1250
                    changed_file_ids.add(result[0])
1302
1251
                    yield result
1303
1252
 
1304
 
    @needs_read_lock
1305
 
    def file_content_matches(self, source_file_id, target_file_id,
1306
 
            source_path=None, target_path=None, source_stat=None, target_stat=None):
1307
 
        """Check if two files are the same in the source and target trees.
1308
 
 
1309
 
        This only checks that the contents of the files are the same,
1310
 
        it does not touch anything else.
1311
 
 
1312
 
        :param source_file_id: File id of the file in the source tree
1313
 
        :param target_file_id: File id of the file in the target tree
1314
 
        :param source_path: Path of the file in the source tree
1315
 
        :param target_path: Path of the file in the target tree
1316
 
        :param source_stat: Optional stat value of the file in the source tree
1317
 
        :param target_stat: Optional stat value of the file in the target tree
1318
 
        :return: Boolean indicating whether the files have the same contents
1319
 
        """
1320
 
        source_verifier_kind, source_verifier_data = self.source.get_file_verifier(
1321
 
            source_file_id, source_path, source_stat)
1322
 
        target_verifier_kind, target_verifier_data = self.target.get_file_verifier(
1323
 
            target_file_id, target_path, target_stat)
1324
 
        if source_verifier_kind == target_verifier_kind:
1325
 
            return (source_verifier_data == target_verifier_data)
1326
 
        # Fall back to SHA1 for now
1327
 
        if source_verifier_kind != "SHA1":
1328
 
            source_sha1 = self.source.get_file_sha1(source_file_id,
1329
 
                    source_path, source_stat)
1330
 
        else:
1331
 
            source_sha1 = source_verifier_data
1332
 
        if target_verifier_kind != "SHA1":
1333
 
            target_sha1 = self.target.get_file_sha1(target_file_id,
1334
 
                    target_path, target_stat)
1335
 
        else:
1336
 
            target_sha1 = target_verifier_data
1337
 
        return (source_sha1 == target_sha1)
1338
 
 
1339
 
InterTree.register_optimiser(InterTree)
1340
 
 
1341
1253
 
1342
1254
class MultiWalker(object):
1343
1255
    """Walk multiple trees simultaneously, getting combined results."""