/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/repository.py

Merge fetch-spec-everything-not-in-other.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005-2010 Canonical Ltd
 
1
# Copyright (C) 2005-2011 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
25
25
    check,
26
26
    chk_map,
27
27
    config,
 
28
    controldir,
28
29
    debug,
29
 
    errors,
30
30
    fetch as _mod_fetch,
31
31
    fifo_cache,
32
32
    generate_ids,
39
39
    lockdir,
40
40
    lru_cache,
41
41
    osutils,
 
42
    pyutils,
42
43
    revision as _mod_revision,
43
44
    static_tuple,
44
 
    symbol_versioning,
45
45
    trace,
46
46
    tsort,
47
 
    ui,
48
47
    versionedfile,
49
48
    )
50
49
from bzrlib.bundle import serializer
53
52
from bzrlib.testament import Testament
54
53
""")
55
54
 
 
55
import sys
 
56
from bzrlib import (
 
57
    errors,
 
58
    registry,
 
59
    symbol_versioning,
 
60
    ui,
 
61
    )
56
62
from bzrlib.decorators import needs_read_lock, needs_write_lock, only_raises
57
63
from bzrlib.inter import InterObject
58
64
from bzrlib.inventory import (
61
67
    ROOT_ID,
62
68
    entry_factory,
63
69
    )
64
 
from bzrlib.lock import _RelockDebugMixin
65
 
from bzrlib import registry
 
70
from bzrlib.recordcounter import RecordCounter
 
71
from bzrlib.lock import _RelockDebugMixin, LogicalLockResult
66
72
from bzrlib.trace import (
67
73
    log_exception_quietly, note, mutter, mutter_callsite, warning)
68
74
 
71
77
_deprecation_warning_done = False
72
78
 
73
79
 
 
80
class IsInWriteGroupError(errors.InternalBzrError):
 
81
 
 
82
    _fmt = "May not refresh_data of repo %(repo)s while in a write group."
 
83
 
 
84
    def __init__(self, repo):
 
85
        errors.InternalBzrError.__init__(self, repo=repo)
 
86
 
 
87
 
74
88
class CommitBuilder(object):
75
89
    """Provides an interface to build up a commit.
76
90
 
101
115
 
102
116
        if committer is None:
103
117
            self._committer = self._config.username()
 
118
        elif not isinstance(committer, unicode):
 
119
            self._committer = committer.decode() # throw if non-ascii
104
120
        else:
105
121
            self._committer = committer
106
122
 
160
176
            self._validate_unicode_text(value,
161
177
                                        'revision property (%s)' % (key,))
162
178
 
 
179
    def _ensure_fallback_inventories(self):
 
180
        """Ensure that appropriate inventories are available.
 
181
 
 
182
        This only applies to repositories that are stacked, and is about
 
183
        enusring the stacking invariants. Namely, that for any revision that is
 
184
        present, we either have all of the file content, or we have the parent
 
185
        inventory and the delta file content.
 
186
        """
 
187
        if not self.repository._fallback_repositories:
 
188
            return
 
189
        if not self.repository._format.supports_chks:
 
190
            raise errors.BzrError("Cannot commit directly to a stacked branch"
 
191
                " in pre-2a formats. See "
 
192
                "https://bugs.launchpad.net/bzr/+bug/375013 for details.")
 
193
        # This is a stacked repo, we need to make sure we have the parent
 
194
        # inventories for the parents.
 
195
        parent_keys = [(p,) for p in self.parents]
 
196
        parent_map = self.repository.inventories._index.get_parent_map(parent_keys)
 
197
        missing_parent_keys = set([pk for pk in parent_keys
 
198
                                       if pk not in parent_map])
 
199
        fallback_repos = list(reversed(self.repository._fallback_repositories))
 
200
        missing_keys = [('inventories', pk[0])
 
201
                        for pk in missing_parent_keys]
 
202
        resume_tokens = []
 
203
        while missing_keys and fallback_repos:
 
204
            fallback_repo = fallback_repos.pop()
 
205
            source = fallback_repo._get_source(self.repository._format)
 
206
            sink = self.repository._get_sink()
 
207
            stream = source.get_stream_for_missing_keys(missing_keys)
 
208
            missing_keys = sink.insert_stream_without_locking(stream,
 
209
                self.repository._format)
 
210
        if missing_keys:
 
211
            raise errors.BzrError('Unable to fill in parent inventories for a'
 
212
                                  ' stacked branch')
 
213
 
163
214
    def commit(self, message):
164
215
        """Make the actual commit.
165
216
 
177
228
        rev.parent_ids = self.parents
178
229
        self.repository.add_revision(self._new_revision_id, rev,
179
230
            self.new_inventory, self._config)
 
231
        self._ensure_fallback_inventories()
180
232
        self.repository.commit_write_group()
181
233
        return self._new_revision_id
182
234
 
231
283
 
232
284
    def _gen_revision_id(self):
233
285
        """Return new revision-id."""
234
 
        return generate_ids.gen_revision_id(self._config.username(),
235
 
                                            self._timestamp)
 
286
        return generate_ids.gen_revision_id(self._committer, self._timestamp)
236
287
 
237
288
    def _generate_revision_if_needed(self):
238
289
        """Create a revision id if None was supplied.
278
329
 
279
330
        :param tree: The tree which is being committed.
280
331
        """
281
 
        # NB: if there are no parents then this method is not called, so no
282
 
        # need to guard on parents having length.
 
332
        if len(self.parents) == 0:
 
333
            raise errors.RootMissing()
283
334
        entry = entry_factory['directory'](tree.path2id(''), '',
284
335
            None)
285
336
        entry.revision = self._new_revision_id
423
474
            else:
424
475
                # we don't need to commit this, because the caller already
425
476
                # determined that an existing revision of this file is
426
 
                # appropriate. If its not being considered for committing then
 
477
                # appropriate. If it's not being considered for committing then
427
478
                # it and all its parents to the root must be unaltered so
428
479
                # no-change against the basis.
429
480
                if ie.revision == self._new_revision_id:
745
796
                    # after iter_changes examines and decides it has changed,
746
797
                    # we will unconditionally record a new version even if some
747
798
                    # other process reverts it while commit is running (with
748
 
                    # the revert happening after iter_changes did it's
 
799
                    # the revert happening after iter_changes did its
749
800
                    # examination).
750
801
                    if change[7][1]:
751
802
                        entry.executable = True
860
911
        # versioned roots do not change unless the tree found a change.
861
912
 
862
913
 
 
914
class RepositoryWriteLockResult(LogicalLockResult):
 
915
    """The result of write locking a repository.
 
916
 
 
917
    :ivar repository_token: The token obtained from the underlying lock, or
 
918
        None.
 
919
    :ivar unlock: A callable which will unlock the lock.
 
920
    """
 
921
 
 
922
    def __init__(self, unlock, repository_token):
 
923
        LogicalLockResult.__init__(self, unlock)
 
924
        self.repository_token = repository_token
 
925
 
 
926
    def __repr__(self):
 
927
        return "RepositoryWriteLockResult(%s, %s)" % (self.repository_token,
 
928
            self.unlock)
 
929
 
 
930
 
863
931
######################################################################
864
932
# Repositories
865
933
 
866
934
 
867
 
class Repository(_RelockDebugMixin, bzrdir.ControlComponent):
 
935
class Repository(_RelockDebugMixin, controldir.ControlComponent):
868
936
    """Repository holding history for one or more branches.
869
937
 
870
938
    The repository holds and retrieves historical information including
917
985
        pointing to .bzr/repository.
918
986
    """
919
987
 
920
 
    # What class to use for a CommitBuilder. Often its simpler to change this
 
988
    # What class to use for a CommitBuilder. Often it's simpler to change this
921
989
    # in a Repository class subclass rather than to override
922
990
    # get_commit_builder.
923
991
    _commit_builder_class = CommitBuilder
1018
1086
                " id and insertion revid (%r, %r)"
1019
1087
                % (inv.revision_id, revision_id))
1020
1088
        if inv.root is None:
1021
 
            raise AssertionError()
 
1089
            raise errors.RootMissing()
1022
1090
        return self._add_inventory_checked(revision_id, inv, parents)
1023
1091
 
1024
1092
    def _add_inventory_checked(self, revision_id, inv, parents):
1376
1444
        data during reads, and allows a 'write_group' to be obtained. Write
1377
1445
        groups must be used for actual data insertion.
1378
1446
 
 
1447
        A token should be passed in if you know that you have locked the object
 
1448
        some other way, and need to synchronise this object's state with that
 
1449
        fact.
 
1450
 
 
1451
        XXX: this docstring is duplicated in many places, e.g. lockable_files.py
 
1452
 
1379
1453
        :param token: if this is already locked, then lock_write will fail
1380
1454
            unless the token matches the existing lock.
1381
1455
        :returns: a token if this instance supports tokens, otherwise None.
1384
1458
        :raises MismatchedToken: if the specified token doesn't match the token
1385
1459
            of the existing lock.
1386
1460
        :seealso: start_write_group.
1387
 
 
1388
 
        A token should be passed in if you know that you have locked the object
1389
 
        some other way, and need to synchronise this object's state with that
1390
 
        fact.
1391
 
 
1392
 
        XXX: this docstring is duplicated in many places, e.g. lockable_files.py
 
1461
        :return: A RepositoryWriteLockResult.
1393
1462
        """
1394
1463
        locked = self.is_locked()
1395
 
        result = self.control_files.lock_write(token=token)
 
1464
        token = self.control_files.lock_write(token=token)
1396
1465
        if not locked:
1397
1466
            self._warn_if_deprecated()
1398
1467
            self._note_lock('w')
1400
1469
                # Writes don't affect fallback repos
1401
1470
                repo.lock_read()
1402
1471
            self._refresh_data()
1403
 
        return result
 
1472
        return RepositoryWriteLockResult(self.unlock, token)
1404
1473
 
1405
1474
    def lock_read(self):
 
1475
        """Lock the repository for read operations.
 
1476
 
 
1477
        :return: An object with an unlock method which will release the lock
 
1478
            obtained.
 
1479
        """
1406
1480
        locked = self.is_locked()
1407
1481
        self.control_files.lock_read()
1408
1482
        if not locked:
1411
1485
            for repo in self._fallback_repositories:
1412
1486
                repo.lock_read()
1413
1487
            self._refresh_data()
 
1488
        return LogicalLockResult(self.unlock)
1414
1489
 
1415
1490
    def get_physical_lock_status(self):
1416
1491
        return self.control_files.get_physical_lock_status()
1522
1597
        return ret
1523
1598
 
1524
1599
    @needs_read_lock
1525
 
    def search_missing_revision_ids(self, other, revision_id=None, find_ghosts=True):
 
1600
    def search_missing_revision_ids(self, other,
 
1601
            revision_id=symbol_versioning.DEPRECATED_PARAMETER,
 
1602
            find_ghosts=True, revision_ids=None, if_present_ids=None):
1526
1603
        """Return the revision ids that other has that this does not.
1527
1604
 
1528
1605
        These are returned in topological order.
1529
1606
 
1530
1607
        revision_id: only return revision ids included by revision_id.
1531
1608
        """
 
1609
        if symbol_versioning.deprecated_passed(revision_id):
 
1610
            symbol_versioning.warn(
 
1611
                'search_missing_revision_ids(revision_id=...) was '
 
1612
                'deprecated in 2.3.  Use revision_ids=[...] instead.',
 
1613
                DeprecationWarning, stacklevel=3)
 
1614
            if revision_ids is not None:
 
1615
                raise AssertionError(
 
1616
                    'revision_ids is mutually exclusive with revision_id')
 
1617
            if revision_id is not None:
 
1618
                revision_ids = [revision_id]
1532
1619
        return InterRepository.get(other, self).search_missing_revision_ids(
1533
 
            revision_id, find_ghosts)
 
1620
            find_ghosts=find_ghosts, revision_ids=revision_ids,
 
1621
            if_present_ids=if_present_ids)
1534
1622
 
1535
1623
    @staticmethod
1536
1624
    def open(base):
1634
1722
        return missing_keys
1635
1723
 
1636
1724
    def refresh_data(self):
1637
 
        """Re-read any data needed to to synchronise with disk.
 
1725
        """Re-read any data needed to synchronise with disk.
1638
1726
 
1639
1727
        This method is intended to be called after another repository instance
1640
1728
        (such as one used by a smart server) has inserted data into the
1641
 
        repository. It may not be called during a write group, but may be
1642
 
        called at any other time.
 
1729
        repository. On all repositories this will work outside of write groups.
 
1730
        Some repository formats (pack and newer for bzrlib native formats)
 
1731
        support refresh_data inside write groups. If called inside a write
 
1732
        group on a repository that does not support refreshing in a write group
 
1733
        IsInWriteGroupError will be raised.
1643
1734
        """
1644
 
        if self.is_in_write_group():
1645
 
            raise errors.InternalBzrError(
1646
 
                "May not refresh_data while in a write group.")
1647
1735
        self._refresh_data()
1648
1736
 
1649
1737
    def resume_write_group(self, tokens):
1688
1776
                "May not fetch while in a write group.")
1689
1777
        # fast path same-url fetch operations
1690
1778
        # TODO: lift out to somewhere common with RemoteRepository
1691
 
        # <https://bugs.edge.launchpad.net/bzr/+bug/401646>
 
1779
        # <https://bugs.launchpad.net/bzr/+bug/401646>
1692
1780
        if (self.has_same_location(source)
1693
1781
            and fetch_spec is None
1694
1782
            and self._has_same_fallbacks(source)):
1698
1786
                not _mod_revision.is_null(revision_id)):
1699
1787
                self.get_revision(revision_id)
1700
1788
            return 0, []
1701
 
        # if there is no specific appropriate InterRepository, this will get
1702
 
        # the InterRepository base class, which raises an
1703
 
        # IncompatibleRepositories when asked to fetch.
1704
1789
        inter = InterRepository.get(source, self)
1705
1790
        return inter.fetch(revision_id=revision_id, pb=pb,
1706
1791
            find_ghosts=find_ghosts, fetch_spec=fetch_spec)
1722
1807
        :param revprops: Optional dictionary of revision properties.
1723
1808
        :param revision_id: Optional revision id.
1724
1809
        """
1725
 
        if self._fallback_repositories:
1726
 
            raise errors.BzrError("Cannot commit from a lightweight checkout "
1727
 
                "to a stacked branch. See "
 
1810
        if self._fallback_repositories and not self._format.supports_chks:
 
1811
            raise errors.BzrError("Cannot commit directly to a stacked branch"
 
1812
                " in pre-2a formats. See "
1728
1813
                "https://bugs.launchpad.net/bzr/+bug/375013 for details.")
1729
1814
        result = self._commit_builder_class(self, parents, config,
1730
1815
            timestamp, timezone, committer, revprops, revision_id)
2476
2561
            ancestors will be traversed.
2477
2562
        """
2478
2563
        graph = self.get_graph()
2479
 
        next_id = revision_id
2480
 
        while True:
2481
 
            if next_id in (None, _mod_revision.NULL_REVISION):
2482
 
                return
2483
 
            try:
2484
 
                parents = graph.get_parent_map([next_id])[next_id]
2485
 
            except KeyError:
2486
 
                raise errors.RevisionNotPresent(next_id, self)
2487
 
            yield next_id
2488
 
            if len(parents) == 0:
2489
 
                return
2490
 
            else:
2491
 
                next_id = parents[0]
 
2564
        stop_revisions = (None, _mod_revision.NULL_REVISION)
 
2565
        return graph.iter_lefthand_ancestry(revision_id, stop_revisions)
2492
2566
 
2493
2567
    def is_shared(self):
2494
2568
        """Return True if this repository is flagged as a shared repository."""
2595
2669
        types it should be a no-op that just returns.
2596
2670
 
2597
2671
        This stub method does not require a lock, but subclasses should use
2598
 
        @needs_write_lock as this is a long running call its reasonable to
 
2672
        @needs_write_lock as this is a long running call it's reasonable to
2599
2673
        implicitly lock for the user.
2600
2674
 
2601
2675
        :param hint: If not supplied, the whole repository is packed.
2794
2868
        raise NotImplementedError(self.revision_graph_can_have_wrong_parents)
2795
2869
 
2796
2870
 
2797
 
# remove these delegates a while after bzr 0.15
2798
 
def __make_delegated(name, from_module):
2799
 
    def _deprecated_repository_forwarder():
2800
 
        symbol_versioning.warn('%s moved to %s in bzr 0.15'
2801
 
            % (name, from_module),
2802
 
            DeprecationWarning,
2803
 
            stacklevel=2)
2804
 
        m = __import__(from_module, globals(), locals(), [name])
2805
 
        try:
2806
 
            return getattr(m, name)
2807
 
        except AttributeError:
2808
 
            raise AttributeError('module %s has no name %s'
2809
 
                    % (m, name))
2810
 
    globals()[name] = _deprecated_repository_forwarder
2811
 
 
2812
 
for _name in [
2813
 
        'AllInOneRepository',
2814
 
        'WeaveMetaDirRepository',
2815
 
        'PreSplitOutRepositoryFormat',
2816
 
        'RepositoryFormat4',
2817
 
        'RepositoryFormat5',
2818
 
        'RepositoryFormat6',
2819
 
        'RepositoryFormat7',
2820
 
        ]:
2821
 
    __make_delegated(_name, 'bzrlib.repofmt.weaverepo')
2822
 
 
2823
 
for _name in [
2824
 
        'KnitRepository',
2825
 
        'RepositoryFormatKnit',
2826
 
        'RepositoryFormatKnit1',
2827
 
        ]:
2828
 
    __make_delegated(_name, 'bzrlib.repofmt.knitrepo')
2829
 
 
2830
 
 
2831
2871
def install_revision(repository, rev, revision_tree):
2832
2872
    """Install all revision data into a repository."""
2833
2873
    install_revisions(repository, [(rev, revision_tree, None)])
3325
3365
    'bzrlib.repofmt.pack_repo',
3326
3366
    'RepositoryFormatKnitPack6RichRoot',
3327
3367
    )
 
3368
format_registry.register_lazy(
 
3369
    'Bazaar repository format 2a (needs bzr 1.16 or later)\n',
 
3370
    'bzrlib.repofmt.groupcompress_repo',
 
3371
    'RepositoryFormat2a',
 
3372
    )
3328
3373
 
3329
3374
# Development formats.
3330
 
# Obsolete but kept pending a CHK based subtree format.
 
3375
# Check their docstrings to see if/when they are obsolete.
3331
3376
format_registry.register_lazy(
3332
3377
    ("Bazaar development format 2 with subtree support "
3333
3378
        "(needs bzr.dev from before 1.8)\n"),
3334
3379
    'bzrlib.repofmt.pack_repo',
3335
3380
    'RepositoryFormatPackDevelopment2Subtree',
3336
3381
    )
3337
 
 
3338
 
# 1.14->1.16 go below here
3339
 
format_registry.register_lazy(
3340
 
    'Bazaar development format - group compression and chk inventory'
3341
 
        ' (needs bzr.dev from 1.14)\n',
3342
 
    'bzrlib.repofmt.groupcompress_repo',
3343
 
    'RepositoryFormatCHK1',
3344
 
    )
3345
 
 
3346
 
format_registry.register_lazy(
3347
 
    'Bazaar development format - chk repository with bencode revision '
3348
 
        'serialization (needs bzr.dev from 1.16)\n',
3349
 
    'bzrlib.repofmt.groupcompress_repo',
3350
 
    'RepositoryFormatCHK2',
3351
 
    )
3352
 
format_registry.register_lazy(
3353
 
    'Bazaar repository format 2a (needs bzr 1.16 or later)\n',
3354
 
    'bzrlib.repofmt.groupcompress_repo',
3355
 
    'RepositoryFormat2a',
 
3382
format_registry.register_lazy(
 
3383
    'Bazaar development format 8\n',
 
3384
    'bzrlib.repofmt.groupcompress_repo',
 
3385
    'RepositoryFormat2aSubtree',
3356
3386
    )
3357
3387
 
3358
3388
 
3413
3443
                               fetch_spec=fetch_spec,
3414
3444
                               find_ghosts=find_ghosts)
3415
3445
 
3416
 
    def _walk_to_common_revisions(self, revision_ids):
 
3446
    def _walk_to_common_revisions(self, revision_ids, if_present_ids=None):
3417
3447
        """Walk out from revision_ids in source to revisions target has.
3418
3448
 
3419
3449
        :param revision_ids: The start point for the search.
3421
3451
        """
3422
3452
        target_graph = self.target.get_graph()
3423
3453
        revision_ids = frozenset(revision_ids)
 
3454
        if if_present_ids:
 
3455
            all_wanted_revs = revision_ids.union(if_present_ids)
 
3456
        else:
 
3457
            all_wanted_revs = revision_ids
3424
3458
        missing_revs = set()
3425
3459
        source_graph = self.source.get_graph()
3426
3460
        # ensure we don't pay silly lookup costs.
3427
 
        searcher = source_graph._make_breadth_first_searcher(revision_ids)
 
3461
        searcher = source_graph._make_breadth_first_searcher(all_wanted_revs)
3428
3462
        null_set = frozenset([_mod_revision.NULL_REVISION])
3429
3463
        searcher_exhausted = False
3430
3464
        while True:
3443
3477
            # them, make sure that they are present in the target.
3444
3478
            # We don't care about other ghosts as we can't fetch them and
3445
3479
            # haven't been asked to.
 
3480
            mutter('reqd: %r  if-present: %r  ->  ghosts: %r', revision_ids,
 
3481
                if_present_ids, ghosts)
3446
3482
            ghosts_to_check = set(revision_ids.intersection(ghosts))
3447
3483
            revs_to_get = set(next_revs).union(ghosts_to_check)
 
3484
            mutter('ghosts_to_check: %r  revs_to_get: %r  searcher_exhausted: %r',
 
3485
                ghosts_to_check, revs_to_get, searcher_exhausted)
3448
3486
            if revs_to_get:
3449
3487
                have_revs = set(target_graph.get_parent_map(revs_to_get))
3450
3488
                # we always have NULL_REVISION present.
3466
3504
        return searcher.get_result()
3467
3505
 
3468
3506
    @needs_read_lock
3469
 
    def search_missing_revision_ids(self, revision_id=None, find_ghosts=True):
 
3507
    def search_missing_revision_ids(self,
 
3508
            revision_id=symbol_versioning.DEPRECATED_PARAMETER,
 
3509
            find_ghosts=True, revision_ids=None, if_present_ids=None):
3470
3510
        """Return the revision ids that source has that target does not.
3471
3511
 
3472
3512
        :param revision_id: only return revision ids included by this
3473
 
                            revision_id.
 
3513
            revision_id.
 
3514
        :param revision_ids: return revision ids included by these
 
3515
            revision_ids.  NoSuchRevision will be raised if any of these
 
3516
            revisions are not present.
 
3517
        :param if_present_ids: like revision_ids, but will not cause
 
3518
            NoSuchRevision if any of these are absent, instead they will simply
 
3519
            not be in the result.  This is useful for e.g. finding revisions
 
3520
            to fetch for tags, which may reference absent revisions.
3474
3521
        :param find_ghosts: If True find missing revisions in deep history
3475
3522
            rather than just finding the surface difference.
3476
3523
        :return: A bzrlib.graph.SearchResult.
3477
3524
        """
 
3525
        if symbol_versioning.deprecated_passed(revision_id):
 
3526
            symbol_versioning.warn(
 
3527
                'search_missing_revision_ids(revision_id=...) was '
 
3528
                'deprecated in 2.3.  Use revision_ids=[...] instead.',
 
3529
                DeprecationWarning, stacklevel=2)
 
3530
            if revision_ids is not None:
 
3531
                raise AssertionError(
 
3532
                    'revision_ids is mutually exclusive with revision_id')
 
3533
            if revision_id is not None:
 
3534
                revision_ids = [revision_id]
 
3535
        del revision_id
3478
3536
        # stop searching at found target revisions.
3479
 
        if not find_ghosts and revision_id is not None:
3480
 
            return self._walk_to_common_revisions([revision_id])
 
3537
        if not find_ghosts and (revision_ids is not None or if_present_ids is
 
3538
                not None):
 
3539
            return self._walk_to_common_revisions(revision_ids,
 
3540
                    if_present_ids=if_present_ids)
3481
3541
        # generic, possibly worst case, slow code path.
3482
3542
        target_ids = set(self.target.all_revision_ids())
3483
 
        if revision_id is not None:
3484
 
            source_ids = self.source.get_ancestry(revision_id)
3485
 
            if source_ids[0] is not None:
3486
 
                raise AssertionError()
3487
 
            source_ids.pop(0)
3488
 
        else:
3489
 
            source_ids = self.source.all_revision_ids()
 
3543
        source_ids = self._present_source_revisions_for(
 
3544
            revision_ids, if_present_ids)
3490
3545
        result_set = set(source_ids).difference(target_ids)
3491
3546
        return self.source.revision_ids_to_search_result(result_set)
3492
3547
 
 
3548
    def _present_source_revisions_for(self, revision_ids, if_present_ids=None):
 
3549
        """Returns set of all revisions in ancestry of revision_ids present in
 
3550
        the source repo.
 
3551
 
 
3552
        :param revision_ids: if None, all revisions in source are returned.
 
3553
        :param if_present_ids: like revision_ids, but if any/all of these are
 
3554
            absent no error is raised.
 
3555
        """
 
3556
        if revision_ids is not None or if_present_ids is not None:
 
3557
            # First, ensure all specified revisions exist.  Callers expect
 
3558
            # NoSuchRevision when they pass absent revision_ids here.
 
3559
            if revision_ids is None:
 
3560
                revision_ids = set()
 
3561
            if if_present_ids is None:
 
3562
                if_present_ids = set()
 
3563
            revision_ids = set(revision_ids)
 
3564
            if_present_ids = set(if_present_ids)
 
3565
            all_wanted_ids = revision_ids.union(if_present_ids)
 
3566
            graph = self.source.get_graph()
 
3567
            present_revs = set(graph.get_parent_map(all_wanted_ids))
 
3568
            missing = revision_ids.difference(present_revs)
 
3569
            if missing:
 
3570
                raise errors.NoSuchRevision(self.source, missing.pop())
 
3571
            found_ids = all_wanted_ids.intersection(present_revs)
 
3572
            source_ids = [rev_id for (rev_id, parents) in
 
3573
                          graph.iter_ancestry(found_ids)
 
3574
                          if rev_id != _mod_revision.NULL_REVISION
 
3575
                          and parents is not None]
 
3576
        else:
 
3577
            source_ids = self.source.all_revision_ids()
 
3578
        return set(source_ids)
 
3579
 
3493
3580
    @staticmethod
3494
3581
    def _same_model(source, target):
3495
3582
        """True if source and target have the same data representation.
3536
3623
        return InterRepository._same_model(source, target)
3537
3624
 
3538
3625
 
3539
 
class InterWeaveRepo(InterSameDataRepository):
3540
 
    """Optimised code paths between Weave based repositories.
3541
 
 
3542
 
    This should be in bzrlib/repofmt/weaverepo.py but we have not yet
3543
 
    implemented lazy inter-object optimisation.
3544
 
    """
3545
 
 
3546
 
    @classmethod
3547
 
    def _get_repo_format_to_test(self):
3548
 
        from bzrlib.repofmt import weaverepo
3549
 
        return weaverepo.RepositoryFormat7()
3550
 
 
3551
 
    @staticmethod
3552
 
    def is_compatible(source, target):
3553
 
        """Be compatible with known Weave formats.
3554
 
 
3555
 
        We don't test for the stores being of specific types because that
3556
 
        could lead to confusing results, and there is no need to be
3557
 
        overly general.
3558
 
        """
3559
 
        from bzrlib.repofmt.weaverepo import (
3560
 
                RepositoryFormat5,
3561
 
                RepositoryFormat6,
3562
 
                RepositoryFormat7,
3563
 
                )
3564
 
        try:
3565
 
            return (isinstance(source._format, (RepositoryFormat5,
3566
 
                                                RepositoryFormat6,
3567
 
                                                RepositoryFormat7)) and
3568
 
                    isinstance(target._format, (RepositoryFormat5,
3569
 
                                                RepositoryFormat6,
3570
 
                                                RepositoryFormat7)))
3571
 
        except AttributeError:
3572
 
            return False
3573
 
 
3574
 
    @needs_write_lock
3575
 
    def copy_content(self, revision_id=None):
3576
 
        """See InterRepository.copy_content()."""
3577
 
        # weave specific optimised path:
3578
 
        try:
3579
 
            self.target.set_make_working_trees(self.source.make_working_trees())
3580
 
        except (errors.RepositoryUpgradeRequired, NotImplemented):
3581
 
            pass
3582
 
        # FIXME do not peek!
3583
 
        if self.source._transport.listable():
3584
 
            pb = ui.ui_factory.nested_progress_bar()
3585
 
            try:
3586
 
                self.target.texts.insert_record_stream(
3587
 
                    self.source.texts.get_record_stream(
3588
 
                        self.source.texts.keys(), 'topological', False))
3589
 
                pb.update('Copying inventory', 0, 1)
3590
 
                self.target.inventories.insert_record_stream(
3591
 
                    self.source.inventories.get_record_stream(
3592
 
                        self.source.inventories.keys(), 'topological', False))
3593
 
                self.target.signatures.insert_record_stream(
3594
 
                    self.source.signatures.get_record_stream(
3595
 
                        self.source.signatures.keys(),
3596
 
                        'unordered', True))
3597
 
                self.target.revisions.insert_record_stream(
3598
 
                    self.source.revisions.get_record_stream(
3599
 
                        self.source.revisions.keys(),
3600
 
                        'topological', True))
3601
 
            finally:
3602
 
                pb.finished()
3603
 
        else:
3604
 
            self.target.fetch(self.source, revision_id=revision_id)
3605
 
 
3606
 
    @needs_read_lock
3607
 
    def search_missing_revision_ids(self, revision_id=None, find_ghosts=True):
3608
 
        """See InterRepository.missing_revision_ids()."""
3609
 
        # we want all revisions to satisfy revision_id in source.
3610
 
        # but we don't want to stat every file here and there.
3611
 
        # we want then, all revisions other needs to satisfy revision_id
3612
 
        # checked, but not those that we have locally.
3613
 
        # so the first thing is to get a subset of the revisions to
3614
 
        # satisfy revision_id in source, and then eliminate those that
3615
 
        # we do already have.
3616
 
        # this is slow on high latency connection to self, but as this
3617
 
        # disk format scales terribly for push anyway due to rewriting
3618
 
        # inventory.weave, this is considered acceptable.
3619
 
        # - RBC 20060209
3620
 
        if revision_id is not None:
3621
 
            source_ids = self.source.get_ancestry(revision_id)
3622
 
            if source_ids[0] is not None:
3623
 
                raise AssertionError()
3624
 
            source_ids.pop(0)
3625
 
        else:
3626
 
            source_ids = self.source._all_possible_ids()
3627
 
        source_ids_set = set(source_ids)
3628
 
        # source_ids is the worst possible case we may need to pull.
3629
 
        # now we want to filter source_ids against what we actually
3630
 
        # have in target, but don't try to check for existence where we know
3631
 
        # we do not have a revision as that would be pointless.
3632
 
        target_ids = set(self.target._all_possible_ids())
3633
 
        possibly_present_revisions = target_ids.intersection(source_ids_set)
3634
 
        actually_present_revisions = set(
3635
 
            self.target._eliminate_revisions_not_present(possibly_present_revisions))
3636
 
        required_revisions = source_ids_set.difference(actually_present_revisions)
3637
 
        if revision_id is not None:
3638
 
            # we used get_ancestry to determine source_ids then we are assured all
3639
 
            # revisions referenced are present as they are installed in topological order.
3640
 
            # and the tip revision was validated by get_ancestry.
3641
 
            result_set = required_revisions
3642
 
        else:
3643
 
            # if we just grabbed the possibly available ids, then
3644
 
            # we only have an estimate of whats available and need to validate
3645
 
            # that against the revision records.
3646
 
            result_set = set(
3647
 
                self.source._eliminate_revisions_not_present(required_revisions))
3648
 
        return self.source.revision_ids_to_search_result(result_set)
3649
 
 
3650
 
 
3651
 
class InterKnitRepo(InterSameDataRepository):
3652
 
    """Optimised code paths between Knit based repositories."""
3653
 
 
3654
 
    @classmethod
3655
 
    def _get_repo_format_to_test(self):
3656
 
        from bzrlib.repofmt import knitrepo
3657
 
        return knitrepo.RepositoryFormatKnit1()
3658
 
 
3659
 
    @staticmethod
3660
 
    def is_compatible(source, target):
3661
 
        """Be compatible with known Knit formats.
3662
 
 
3663
 
        We don't test for the stores being of specific types because that
3664
 
        could lead to confusing results, and there is no need to be
3665
 
        overly general.
3666
 
        """
3667
 
        from bzrlib.repofmt.knitrepo import RepositoryFormatKnit
3668
 
        try:
3669
 
            are_knits = (isinstance(source._format, RepositoryFormatKnit) and
3670
 
                isinstance(target._format, RepositoryFormatKnit))
3671
 
        except AttributeError:
3672
 
            return False
3673
 
        return are_knits and InterRepository._same_model(source, target)
3674
 
 
3675
 
    @needs_read_lock
3676
 
    def search_missing_revision_ids(self, revision_id=None, find_ghosts=True):
3677
 
        """See InterRepository.missing_revision_ids()."""
3678
 
        if revision_id is not None:
3679
 
            source_ids = self.source.get_ancestry(revision_id)
3680
 
            if source_ids[0] is not None:
3681
 
                raise AssertionError()
3682
 
            source_ids.pop(0)
3683
 
        else:
3684
 
            source_ids = self.source.all_revision_ids()
3685
 
        source_ids_set = set(source_ids)
3686
 
        # source_ids is the worst possible case we may need to pull.
3687
 
        # now we want to filter source_ids against what we actually
3688
 
        # have in target, but don't try to check for existence where we know
3689
 
        # we do not have a revision as that would be pointless.
3690
 
        target_ids = set(self.target.all_revision_ids())
3691
 
        possibly_present_revisions = target_ids.intersection(source_ids_set)
3692
 
        actually_present_revisions = set(
3693
 
            self.target._eliminate_revisions_not_present(possibly_present_revisions))
3694
 
        required_revisions = source_ids_set.difference(actually_present_revisions)
3695
 
        if revision_id is not None:
3696
 
            # we used get_ancestry to determine source_ids then we are assured all
3697
 
            # revisions referenced are present as they are installed in topological order.
3698
 
            # and the tip revision was validated by get_ancestry.
3699
 
            result_set = required_revisions
3700
 
        else:
3701
 
            # if we just grabbed the possibly available ids, then
3702
 
            # we only have an estimate of whats available and need to validate
3703
 
            # that against the revision records.
3704
 
            result_set = set(
3705
 
                self.source._eliminate_revisions_not_present(required_revisions))
3706
 
        return self.source.revision_ids_to_search_result(result_set)
3707
 
 
3708
 
 
3709
3626
class InterDifferingSerializer(InterRepository):
3710
3627
 
3711
3628
    @classmethod
3813
3730
                basis_id, delta, current_revision_id, parents_parents)
3814
3731
            cache[current_revision_id] = parent_tree
3815
3732
 
3816
 
    def _fetch_batch(self, revision_ids, basis_id, cache, a_graph=None):
 
3733
    def _fetch_batch(self, revision_ids, basis_id, cache):
3817
3734
        """Fetch across a few revisions.
3818
3735
 
3819
3736
        :param revision_ids: The revisions to copy
3820
3737
        :param basis_id: The revision_id of a tree that must be in cache, used
3821
3738
            as a basis for delta when no other base is available
3822
3739
        :param cache: A cache of RevisionTrees that we can use.
3823
 
        :param a_graph: A Graph object to determine the heads() of the
3824
 
            rich-root data stream.
3825
3740
        :return: The revision_id of the last converted tree. The RevisionTree
3826
3741
            for it will be in cache
3827
3742
        """
3895
3810
        if root_keys_to_create:
3896
3811
            root_stream = _mod_fetch._new_root_data_stream(
3897
3812
                root_keys_to_create, self._revision_id_to_root_id, parent_map,
3898
 
                self.source, graph=a_graph)
 
3813
                self.source)
3899
3814
            to_texts.insert_record_stream(root_stream)
3900
3815
        to_texts.insert_record_stream(from_texts.get_record_stream(
3901
3816
            text_keys, self.target._format._fetch_order,
3958
3873
        cache[basis_id] = basis_tree
3959
3874
        del basis_tree # We don't want to hang on to it here
3960
3875
        hints = []
3961
 
        if self._converting_to_rich_root and len(revision_ids) > 100:
3962
 
            a_graph = _mod_fetch._get_rich_root_heads_graph(self.source,
3963
 
                                                            revision_ids)
3964
 
        else:
3965
 
            a_graph = None
 
3876
        a_graph = None
3966
3877
 
3967
3878
        for offset in range(0, len(revision_ids), batch_size):
3968
3879
            self.target.start_write_group()
3970
3881
                pb.update('Transferring revisions', offset,
3971
3882
                          len(revision_ids))
3972
3883
                batch = revision_ids[offset:offset+batch_size]
3973
 
                basis_id = self._fetch_batch(batch, basis_id, cache,
3974
 
                                             a_graph=a_graph)
 
3884
                basis_id = self._fetch_batch(batch, basis_id, cache)
3975
3885
            except:
3976
3886
                self.source._safe_to_return_from_cache = False
3977
3887
                self.target.abort_write_group()
3990
3900
            fetch_spec=None):
3991
3901
        """See InterRepository.fetch()."""
3992
3902
        if fetch_spec is not None:
3993
 
            raise AssertionError("Not implemented yet...")
 
3903
            if (isinstance(fetch_spec, graph.NotInOtherForRevs) and
 
3904
                    len(fetch_spec.required_ids) == 1 and not
 
3905
                    fetch_spec.if_present_ids):
 
3906
                revision_id = list(fetch_spec.required_ids)[0]
 
3907
                del fetch_spec
 
3908
            else:
 
3909
                raise AssertionError("Not implemented yet...")
3994
3910
        ui.ui_factory.warn_experimental_format_fetch(self)
3995
3911
        if (not self.source.supports_rich_root()
3996
3912
            and self.target.supports_rich_root()):
4003
3919
            ui.ui_factory.show_user_warning('cross_format_fetch',
4004
3920
                from_format=self.source._format,
4005
3921
                to_format=self.target._format)
 
3922
        if revision_id:
 
3923
            search_revision_ids = [revision_id]
 
3924
        else:
 
3925
            search_revision_ids = None
4006
3926
        revision_ids = self.target.search_missing_revision_ids(self.source,
4007
 
            revision_id, find_ghosts=find_ghosts).get_keys()
 
3927
            revision_ids=search_revision_ids, find_ghosts=find_ghosts).get_keys()
4008
3928
        if not revision_ids:
4009
3929
            return 0, 0
4010
3930
        revision_ids = tsort.topo_sort(
4043
3963
            basis_id = first_rev.parent_ids[0]
4044
3964
            # only valid as a basis if the target has it
4045
3965
            self.target.get_revision(basis_id)
4046
 
            # Try to get a basis tree - if its a ghost it will hit the
 
3966
            # Try to get a basis tree - if it's a ghost it will hit the
4047
3967
            # NoSuchRevision case.
4048
3968
            basis_tree = self.source.revision_tree(basis_id)
4049
3969
        except (IndexError, errors.NoSuchRevision):
4054
3974
 
4055
3975
InterRepository.register_optimiser(InterDifferingSerializer)
4056
3976
InterRepository.register_optimiser(InterSameDataRepository)
4057
 
InterRepository.register_optimiser(InterWeaveRepo)
4058
 
InterRepository.register_optimiser(InterKnitRepo)
4059
3977
 
4060
3978
 
4061
3979
class CopyConverter(object):
4249
4167
                is_resume = False
4250
4168
            try:
4251
4169
                # locked_insert_stream performs a commit|suspend.
4252
 
                return self._locked_insert_stream(stream, src_format, is_resume)
 
4170
                missing_keys = self.insert_stream_without_locking(stream,
 
4171
                                    src_format, is_resume)
 
4172
                if missing_keys:
 
4173
                    # suspend the write group and tell the caller what we is
 
4174
                    # missing. We know we can suspend or else we would not have
 
4175
                    # entered this code path. (All repositories that can handle
 
4176
                    # missing keys can handle suspending a write group).
 
4177
                    write_group_tokens = self.target_repo.suspend_write_group()
 
4178
                    return write_group_tokens, missing_keys
 
4179
                hint = self.target_repo.commit_write_group()
 
4180
                to_serializer = self.target_repo._format._serializer
 
4181
                src_serializer = src_format._serializer
 
4182
                if (to_serializer != src_serializer and
 
4183
                    self.target_repo._format.pack_compresses):
 
4184
                    self.target_repo.pack(hint=hint)
 
4185
                return [], set()
4253
4186
            except:
4254
4187
                self.target_repo.abort_write_group(suppress_errors=True)
4255
4188
                raise
4256
4189
        finally:
4257
4190
            self.target_repo.unlock()
4258
4191
 
4259
 
    def _locked_insert_stream(self, stream, src_format, is_resume):
 
4192
    def insert_stream_without_locking(self, stream, src_format,
 
4193
                                      is_resume=False):
 
4194
        """Insert a stream's content into the target repository.
 
4195
 
 
4196
        This assumes that you already have a locked repository and an active
 
4197
        write group.
 
4198
 
 
4199
        :param src_format: a bzr repository format.
 
4200
        :param is_resume: Passed down to get_missing_parent_inventories to
 
4201
            indicate if we should be checking for missing texts at the same
 
4202
            time.
 
4203
 
 
4204
        :return: A set of keys that are missing.
 
4205
        """
 
4206
        if not self.target_repo.is_write_locked():
 
4207
            raise errors.ObjectNotLocked(self)
 
4208
        if not self.target_repo.is_in_write_group():
 
4209
            raise errors.BzrError('you must already be in a write group')
4260
4210
        to_serializer = self.target_repo._format._serializer
4261
4211
        src_serializer = src_format._serializer
4262
4212
        new_pack = None
4302
4252
                # required if the serializers are different only in terms of
4303
4253
                # the inventory.
4304
4254
                if src_serializer == to_serializer:
4305
 
                    self.target_repo.revisions.insert_record_stream(
4306
 
                        substream)
 
4255
                    self.target_repo.revisions.insert_record_stream(substream)
4307
4256
                else:
4308
4257
                    self._extract_and_insert_revisions(substream,
4309
4258
                        src_serializer)
4342
4291
            # cannot even attempt suspending, and missing would have failed
4343
4292
            # during stream insertion.
4344
4293
            missing_keys = set()
4345
 
        else:
4346
 
            if missing_keys:
4347
 
                # suspend the write group and tell the caller what we is
4348
 
                # missing. We know we can suspend or else we would not have
4349
 
                # entered this code path. (All repositories that can handle
4350
 
                # missing keys can handle suspending a write group).
4351
 
                write_group_tokens = self.target_repo.suspend_write_group()
4352
 
                return write_group_tokens, missing_keys
4353
 
        hint = self.target_repo.commit_write_group()
4354
 
        if (to_serializer != src_serializer and
4355
 
            self.target_repo._format.pack_compresses):
4356
 
            self.target_repo.pack(hint=hint)
4357
 
        return [], set()
 
4294
        return missing_keys
4358
4295
 
4359
4296
    def _extract_and_insert_inventory_deltas(self, substream, serializer):
4360
4297
        target_rich_root = self.target_repo._format.rich_root_data
4417
4354
        """Create a StreamSource streaming from from_repository."""
4418
4355
        self.from_repository = from_repository
4419
4356
        self.to_format = to_format
 
4357
        self._record_counter = RecordCounter()
4420
4358
 
4421
4359
    def delta_on_metadata(self):
4422
4360
        """Return True if delta's are permitted on metadata streams.