/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/knitrepo.py

Fix some bit of fetching.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
2
 
#
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
#
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
#
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
from bzrlib.lazy_import import lazy_import
18
 
lazy_import(globals(), """
19
 
from bzrlib import (
20
 
    debug,
21
 
    )
22
 
from bzrlib.store import revision
23
 
from bzrlib.store.revision.knit import KnitRevisionStore
24
 
""")
25
 
from bzrlib import (
26
 
    bzrdir,
27
 
    deprecated_graph,
28
 
    errors,
29
 
    knit,
30
 
    lockable_files,
31
 
    lockdir,
32
 
    osutils,
33
 
    transactions,
34
 
    xml5,
35
 
    xml6,
36
 
    xml7,
37
 
    )
38
 
 
39
 
from bzrlib.decorators import needs_read_lock, needs_write_lock
40
 
from bzrlib.repository import (
41
 
    CommitBuilder,
42
 
    MetaDirRepository,
43
 
    MetaDirRepositoryFormat,
44
 
    RepositoryFormat,
45
 
    RootCommitBuilder,
46
 
    )
47
 
import bzrlib.revision as _mod_revision
48
 
from bzrlib.store.versioned import VersionedFileStore
49
 
from bzrlib.trace import mutter, mutter_callsite
50
 
from bzrlib.util import bencode
51
 
 
52
 
 
53
 
class _KnitParentsProvider(object):
54
 
 
55
 
    def __init__(self, knit):
56
 
        self._knit = knit
57
 
 
58
 
    def __repr__(self):
59
 
        return 'KnitParentsProvider(%r)' % self._knit
60
 
 
61
 
    def get_parents(self, revision_ids):
62
 
        parents_list = []
63
 
        for revision_id in revision_ids:
64
 
            if revision_id == _mod_revision.NULL_REVISION:
65
 
                parents = []
66
 
            else:
67
 
                try:
68
 
                    parents = self._knit.get_parents_with_ghosts(revision_id)
69
 
                except errors.RevisionNotPresent:
70
 
                    parents = None
71
 
                else:
72
 
                    if len(parents) == 0:
73
 
                        parents = [_mod_revision.NULL_REVISION]
74
 
            parents_list.append(parents)
75
 
        return parents_list
76
 
 
77
 
 
78
 
class KnitRepository(MetaDirRepository):
79
 
    """Knit format repository."""
80
 
 
81
 
    # These attributes are inherited from the Repository base class. Setting
82
 
    # them to None ensures that if the constructor is changed to not initialize
83
 
    # them, or a subclass fails to call the constructor, that an error will
84
 
    # occur rather than the system working but generating incorrect data.
85
 
    _commit_builder_class = None
86
 
    _serializer = None
87
 
 
88
 
    def __init__(self, _format, a_bzrdir, control_files, _revision_store,
89
 
        control_store, text_store, _commit_builder_class, _serializer):
90
 
        MetaDirRepository.__init__(self, _format, a_bzrdir, control_files,
91
 
            _revision_store, control_store, text_store)
92
 
        self._commit_builder_class = _commit_builder_class
93
 
        self._serializer = _serializer
94
 
        self._reconcile_fixes_text_parents = True
95
 
 
96
 
    def _warn_if_deprecated(self):
97
 
        # This class isn't deprecated
98
 
        pass
99
 
 
100
 
    def _inventory_add_lines(self, inv_vf, revid, parents, lines, check_content):
101
 
        return inv_vf.add_lines_with_ghosts(revid, parents, lines,
102
 
            check_content=check_content)[0]
103
 
 
104
 
    @needs_read_lock
105
 
    def _all_revision_ids(self):
106
 
        """See Repository.all_revision_ids()."""
107
 
        # Knits get the revision graph from the index of the revision knit, so
108
 
        # it's always possible even if they're on an unlistable transport.
109
 
        return self._revision_store.all_revision_ids(self.get_transaction())
110
 
 
111
 
    def fileid_involved_between_revs(self, from_revid, to_revid):
112
 
        """Find file_id(s) which are involved in the changes between revisions.
113
 
 
114
 
        This determines the set of revisions which are involved, and then
115
 
        finds all file ids affected by those revisions.
116
 
        """
117
 
        vf = self._get_revision_vf()
118
 
        from_set = set(vf.get_ancestry(from_revid))
119
 
        to_set = set(vf.get_ancestry(to_revid))
120
 
        changed = to_set.difference(from_set)
121
 
        return self._fileid_involved_by_set(changed)
122
 
 
123
 
    def fileid_involved(self, last_revid=None):
124
 
        """Find all file_ids modified in the ancestry of last_revid.
125
 
 
126
 
        :param last_revid: If None, last_revision() will be used.
127
 
        """
128
 
        if not last_revid:
129
 
            changed = set(self.all_revision_ids())
130
 
        else:
131
 
            changed = set(self.get_ancestry(last_revid))
132
 
        if None in changed:
133
 
            changed.remove(None)
134
 
        return self._fileid_involved_by_set(changed)
135
 
 
136
 
    @needs_read_lock
137
 
    def get_ancestry(self, revision_id, topo_sorted=True):
138
 
        """Return a list of revision-ids integrated by a revision.
139
 
        
140
 
        This is topologically sorted, unless 'topo_sorted' is specified as
141
 
        False.
142
 
        """
143
 
        if _mod_revision.is_null(revision_id):
144
 
            return [None]
145
 
        vf = self._get_revision_vf()
146
 
        try:
147
 
            return [None] + vf.get_ancestry(revision_id, topo_sorted)
148
 
        except errors.RevisionNotPresent:
149
 
            raise errors.NoSuchRevision(self, revision_id)
150
 
 
151
 
    @needs_read_lock
152
 
    def get_data_stream(self, revision_ids):
153
 
        """See Repository.get_data_stream."""
154
 
        item_keys = self.item_keys_introduced_by(revision_ids)
155
 
        for knit_kind, file_id, versions in item_keys:
156
 
            name = (knit_kind,)
157
 
            if knit_kind == 'file':
158
 
                name = ('file', file_id)
159
 
                knit = self.weave_store.get_weave_or_empty(
160
 
                    file_id, self.get_transaction())
161
 
            elif knit_kind == 'inventory':
162
 
                knit = self.get_inventory_weave()
163
 
            elif knit_kind == 'revisions':
164
 
                knit = self._revision_store.get_revision_file(
165
 
                    self.get_transaction())
166
 
            elif knit_kind == 'signatures':
167
 
                knit = self._revision_store.get_signature_file(
168
 
                    self.get_transaction())
169
 
            else:
170
 
                raise AssertionError('Unknown knit kind %r' % (knit_kind,))
171
 
            yield name, _get_stream_as_bytes(knit, versions)
172
 
 
173
 
    @needs_read_lock
174
 
    def get_revision(self, revision_id):
175
 
        """Return the Revision object for a named revision"""
176
 
        revision_id = osutils.safe_revision_id(revision_id)
177
 
        return self.get_revision_reconcile(revision_id)
178
 
 
179
 
    @needs_read_lock
180
 
    def get_revision_graph(self, revision_id=None):
181
 
        """Return a dictionary containing the revision graph.
182
 
 
183
 
        :param revision_id: The revision_id to get a graph from. If None, then
184
 
        the entire revision graph is returned. This is a deprecated mode of
185
 
        operation and will be removed in the future.
186
 
        :return: a dictionary of revision_id->revision_parents_list.
187
 
        """
188
 
        if 'evil' in debug.debug_flags:
189
 
            mutter_callsite(3,
190
 
                "get_revision_graph scales with size of history.")
191
 
        # special case NULL_REVISION
192
 
        if revision_id == _mod_revision.NULL_REVISION:
193
 
            return {}
194
 
        a_weave = self._get_revision_vf()
195
 
        if revision_id is None:
196
 
            return a_weave.get_graph()
197
 
        if revision_id not in a_weave:
198
 
            raise errors.NoSuchRevision(self, revision_id)
199
 
        else:
200
 
            # add what can be reached from revision_id
201
 
            return a_weave.get_graph([revision_id])
202
 
 
203
 
    @needs_read_lock
204
 
    def get_revision_graph_with_ghosts(self, revision_ids=None):
205
 
        """Return a graph of the revisions with ghosts marked as applicable.
206
 
 
207
 
        :param revision_ids: an iterable of revisions to graph or None for all.
208
 
        :return: a Graph object with the graph reachable from revision_ids.
209
 
        """
210
 
        if 'evil' in debug.debug_flags:
211
 
            mutter_callsite(3,
212
 
                "get_revision_graph_with_ghosts scales with size of history.")
213
 
        result = deprecated_graph.Graph()
214
 
        vf = self._get_revision_vf()
215
 
        versions = set(vf.versions())
216
 
        if not revision_ids:
217
 
            pending = set(self.all_revision_ids())
218
 
            required = set([])
219
 
        else:
220
 
            pending = set(revision_ids)
221
 
            # special case NULL_REVISION
222
 
            if _mod_revision.NULL_REVISION in pending:
223
 
                pending.remove(_mod_revision.NULL_REVISION)
224
 
            required = set(pending)
225
 
        done = set([])
226
 
        while len(pending):
227
 
            revision_id = pending.pop()
228
 
            if not revision_id in versions:
229
 
                if revision_id in required:
230
 
                    raise errors.NoSuchRevision(self, revision_id)
231
 
                # a ghost
232
 
                result.add_ghost(revision_id)
233
 
                # mark it as done so we don't try for it again.
234
 
                done.add(revision_id)
235
 
                continue
236
 
            parent_ids = vf.get_parents_with_ghosts(revision_id)
237
 
            for parent_id in parent_ids:
238
 
                # is this queued or done ?
239
 
                if (parent_id not in pending and
240
 
                    parent_id not in done):
241
 
                    # no, queue it.
242
 
                    pending.add(parent_id)
243
 
            result.add_node(revision_id, parent_ids)
244
 
            done.add(revision_id)
245
 
        return result
246
 
 
247
 
    def _get_revision_vf(self):
248
 
        """:return: a versioned file containing the revisions."""
249
 
        vf = self._revision_store.get_revision_file(self.get_transaction())
250
 
        return vf
251
 
 
252
 
    def _get_history_vf(self):
253
 
        """Get a versionedfile whose history graph reflects all revisions.
254
 
 
255
 
        For knit repositories, this is the revision knit.
256
 
        """
257
 
        return self._get_revision_vf()
258
 
 
259
 
    @needs_write_lock
260
 
    def reconcile(self, other=None, thorough=False):
261
 
        """Reconcile this repository."""
262
 
        from bzrlib.reconcile import KnitReconciler
263
 
        reconciler = KnitReconciler(self, thorough=thorough)
264
 
        reconciler.reconcile()
265
 
        return reconciler
266
 
    
267
 
    def revision_parents(self, revision_id):
268
 
        return self._get_revision_vf().get_parents(revision_id)
269
 
 
270
 
    def _make_parents_provider(self):
271
 
        return _KnitParentsProvider(self._get_revision_vf())
272
 
 
273
 
    def _find_inconsistent_revision_parents(self):
274
 
        """Find revisions with different parent lists in the revision object
275
 
        and in the index graph.
276
 
 
277
 
        :returns: an iterator yielding tuples of (revison-id, parents-in-index,
278
 
            parents-in-revision).
279
 
        """
280
 
        assert self.is_locked()
281
 
        vf = self._get_revision_vf()
282
 
        for index_version in vf.versions():
283
 
            parents_according_to_index = tuple(vf.get_parents_with_ghosts(
284
 
                index_version))
285
 
            revision = self.get_revision(index_version)
286
 
            parents_according_to_revision = tuple(revision.parent_ids)
287
 
            if parents_according_to_index != parents_according_to_revision:
288
 
                yield (index_version, parents_according_to_index,
289
 
                    parents_according_to_revision)
290
 
 
291
 
    def _check_for_inconsistent_revision_parents(self):
292
 
        inconsistencies = list(self._find_inconsistent_revision_parents())
293
 
        if inconsistencies:
294
 
            raise errors.BzrCheckError(
295
 
                "Revision knit has inconsistent parents.")
296
 
 
297
 
    def revision_graph_can_have_wrong_parents(self):
298
 
        # The revision.kndx could potentially claim a revision has a different
299
 
        # parent to the revision text.
300
 
        return True
301
 
 
302
 
 
303
 
class RepositoryFormatKnit(MetaDirRepositoryFormat):
304
 
    """Bzr repository knit format (generalized). 
305
 
 
306
 
    This repository format has:
307
 
     - knits for file texts and inventory
308
 
     - hash subdirectory based stores.
309
 
     - knits for revisions and signatures
310
 
     - TextStores for revisions and signatures.
311
 
     - a format marker of its own
312
 
     - an optional 'shared-storage' flag
313
 
     - an optional 'no-working-trees' flag
314
 
     - a LockDir lock
315
 
    """
316
 
 
317
 
    # Set this attribute in derived classes to control the repository class
318
 
    # created by open and initialize.
319
 
    repository_class = None
320
 
    # Set this attribute in derived classes to control the
321
 
    # _commit_builder_class that the repository objects will have passed to
322
 
    # their constructor.
323
 
    _commit_builder_class = None
324
 
    # Set this attribute in derived clases to control the _serializer that the
325
 
    # repository objects will have passed to their constructor.
326
 
    _serializer = xml5.serializer_v5
327
 
    # Knit based repositories handle ghosts reasonably well.
328
 
    supports_ghosts = True
329
 
 
330
 
    def _get_control_store(self, repo_transport, control_files):
331
 
        """Return the control store for this repository."""
332
 
        return VersionedFileStore(
333
 
            repo_transport,
334
 
            prefixed=False,
335
 
            file_mode=control_files._file_mode,
336
 
            versionedfile_class=knit.KnitVersionedFile,
337
 
            versionedfile_kwargs={'factory':knit.KnitPlainFactory()},
338
 
            )
339
 
 
340
 
    def _get_revision_store(self, repo_transport, control_files):
341
 
        """See RepositoryFormat._get_revision_store()."""
342
 
        versioned_file_store = VersionedFileStore(
343
 
            repo_transport,
344
 
            file_mode=control_files._file_mode,
345
 
            prefixed=False,
346
 
            precious=True,
347
 
            versionedfile_class=knit.KnitVersionedFile,
348
 
            versionedfile_kwargs={'delta':False,
349
 
                                  'factory':knit.KnitPlainFactory(),
350
 
                                 },
351
 
            escaped=True,
352
 
            )
353
 
        return KnitRevisionStore(versioned_file_store)
354
 
 
355
 
    def _get_text_store(self, transport, control_files):
356
 
        """See RepositoryFormat._get_text_store()."""
357
 
        return self._get_versioned_file_store('knits',
358
 
                                  transport,
359
 
                                  control_files,
360
 
                                  versionedfile_class=knit.KnitVersionedFile,
361
 
                                  versionedfile_kwargs={
362
 
                                      'create_parent_dir':True,
363
 
                                      'delay_create':True,
364
 
                                      'dir_mode':control_files._dir_mode,
365
 
                                  },
366
 
                                  escaped=True)
367
 
 
368
 
    def initialize(self, a_bzrdir, shared=False):
369
 
        """Create a knit format 1 repository.
370
 
 
371
 
        :param a_bzrdir: bzrdir to contain the new repository; must already
372
 
            be initialized.
373
 
        :param shared: If true the repository will be initialized as a shared
374
 
                       repository.
375
 
        """
376
 
        mutter('creating repository in %s.', a_bzrdir.transport.base)
377
 
        dirs = ['knits']
378
 
        files = []
379
 
        utf8_files = [('format', self.get_format_string())]
380
 
        
381
 
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
382
 
        repo_transport = a_bzrdir.get_repository_transport(None)
383
 
        control_files = lockable_files.LockableFiles(repo_transport,
384
 
                                'lock', lockdir.LockDir)
385
 
        control_store = self._get_control_store(repo_transport, control_files)
386
 
        transaction = transactions.WriteTransaction()
387
 
        # trigger a write of the inventory store.
388
 
        control_store.get_weave_or_empty('inventory', transaction)
389
 
        _revision_store = self._get_revision_store(repo_transport, control_files)
390
 
        # the revision id here is irrelevant: it will not be stored, and cannot
391
 
        # already exist.
392
 
        _revision_store.has_revision_id('A', transaction)
393
 
        _revision_store.get_signature_file(transaction)
394
 
        return self.open(a_bzrdir=a_bzrdir, _found=True)
395
 
 
396
 
    def open(self, a_bzrdir, _found=False, _override_transport=None):
397
 
        """See RepositoryFormat.open().
398
 
        
399
 
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
400
 
                                    repository at a slightly different url
401
 
                                    than normal. I.e. during 'upgrade'.
402
 
        """
403
 
        if not _found:
404
 
            format = RepositoryFormat.find_format(a_bzrdir)
405
 
            assert format.__class__ ==  self.__class__
406
 
        if _override_transport is not None:
407
 
            repo_transport = _override_transport
408
 
        else:
409
 
            repo_transport = a_bzrdir.get_repository_transport(None)
410
 
        control_files = lockable_files.LockableFiles(repo_transport,
411
 
                                'lock', lockdir.LockDir)
412
 
        text_store = self._get_text_store(repo_transport, control_files)
413
 
        control_store = self._get_control_store(repo_transport, control_files)
414
 
        _revision_store = self._get_revision_store(repo_transport, control_files)
415
 
        return self.repository_class(_format=self,
416
 
                              a_bzrdir=a_bzrdir,
417
 
                              control_files=control_files,
418
 
                              _revision_store=_revision_store,
419
 
                              control_store=control_store,
420
 
                              text_store=text_store,
421
 
                              _commit_builder_class=self._commit_builder_class,
422
 
                              _serializer=self._serializer)
423
 
 
424
 
 
425
 
class RepositoryFormatKnit1(RepositoryFormatKnit):
426
 
    """Bzr repository knit format 1.
427
 
 
428
 
    This repository format has:
429
 
     - knits for file texts and inventory
430
 
     - hash subdirectory based stores.
431
 
     - knits for revisions and signatures
432
 
     - TextStores for revisions and signatures.
433
 
     - a format marker of its own
434
 
     - an optional 'shared-storage' flag
435
 
     - an optional 'no-working-trees' flag
436
 
     - a LockDir lock
437
 
 
438
 
    This format was introduced in bzr 0.8.
439
 
    """
440
 
 
441
 
    repository_class = KnitRepository
442
 
    _commit_builder_class = CommitBuilder
443
 
    _serializer = xml5.serializer_v5
444
 
 
445
 
    def __ne__(self, other):
446
 
        return self.__class__ is not other.__class__
447
 
 
448
 
    def get_format_string(self):
449
 
        """See RepositoryFormat.get_format_string()."""
450
 
        return "Bazaar-NG Knit Repository Format 1"
451
 
 
452
 
    def get_format_description(self):
453
 
        """See RepositoryFormat.get_format_description()."""
454
 
        return "Knit repository format 1"
455
 
 
456
 
    def check_conversion_target(self, target_format):
457
 
        pass
458
 
 
459
 
 
460
 
class RepositoryFormatKnit3(RepositoryFormatKnit):
461
 
    """Bzr repository knit format 3.
462
 
 
463
 
    This repository format has:
464
 
     - knits for file texts and inventory
465
 
     - hash subdirectory based stores.
466
 
     - knits for revisions and signatures
467
 
     - TextStores for revisions and signatures.
468
 
     - a format marker of its own
469
 
     - an optional 'shared-storage' flag
470
 
     - an optional 'no-working-trees' flag
471
 
     - a LockDir lock
472
 
     - support for recording full info about the tree root
473
 
     - support for recording tree-references
474
 
    """
475
 
 
476
 
    repository_class = KnitRepository
477
 
    _commit_builder_class = RootCommitBuilder
478
 
    rich_root_data = True
479
 
    supports_tree_reference = True
480
 
    _serializer = xml7.serializer_v7
481
 
 
482
 
    def _get_matching_bzrdir(self):
483
 
        return bzrdir.format_registry.make_bzrdir('dirstate-with-subtree')
484
 
 
485
 
    def _ignore_setting_bzrdir(self, format):
486
 
        pass
487
 
 
488
 
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
489
 
 
490
 
    def check_conversion_target(self, target_format):
491
 
        if not target_format.rich_root_data:
492
 
            raise errors.BadConversionTarget(
493
 
                'Does not support rich root data.', target_format)
494
 
        if not getattr(target_format, 'supports_tree_reference', False):
495
 
            raise errors.BadConversionTarget(
496
 
                'Does not support nested trees', target_format)
497
 
            
498
 
    def get_format_string(self):
499
 
        """See RepositoryFormat.get_format_string()."""
500
 
        return "Bazaar Knit Repository Format 3 (bzr 0.15)\n"
501
 
 
502
 
    def get_format_description(self):
503
 
        """See RepositoryFormat.get_format_description()."""
504
 
        return "Knit repository format 3"
505
 
 
506
 
 
507
 
class RepositoryFormatKnit4(RepositoryFormatKnit):
508
 
    """Bzr repository knit format 4.
509
 
 
510
 
    This repository format has everything in format 3, except for
511
 
    tree-references:
512
 
     - knits for file texts and inventory
513
 
     - hash subdirectory based stores.
514
 
     - knits for revisions and signatures
515
 
     - TextStores for revisions and signatures.
516
 
     - a format marker of its own
517
 
     - an optional 'shared-storage' flag
518
 
     - an optional 'no-working-trees' flag
519
 
     - a LockDir lock
520
 
     - support for recording full info about the tree root
521
 
    """
522
 
 
523
 
    repository_class = KnitRepository
524
 
    _commit_builder_class = RootCommitBuilder
525
 
    rich_root_data = True
526
 
    supports_tree_reference = False
527
 
    _serializer = xml6.serializer_v6
528
 
 
529
 
    def _get_matching_bzrdir(self):
530
 
        return bzrdir.format_registry.make_bzrdir('rich-root')
531
 
 
532
 
    def _ignore_setting_bzrdir(self, format):
533
 
        pass
534
 
 
535
 
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
536
 
 
537
 
    def check_conversion_target(self, target_format):
538
 
        if not target_format.rich_root_data:
539
 
            raise errors.BadConversionTarget(
540
 
                'Does not support rich root data.', target_format)
541
 
 
542
 
    def get_format_string(self):
543
 
        """See RepositoryFormat.get_format_string()."""
544
 
        return 'Bazaar Knit Repository Format 4 (bzr 1.0)\n'
545
 
 
546
 
    def get_format_description(self):
547
 
        """See RepositoryFormat.get_format_description()."""
548
 
        return "Knit repository format 4"
549
 
 
550
 
 
551
 
def _get_stream_as_bytes(knit, required_versions):
552
 
    """Generate a serialised data stream.
553
 
 
554
 
    The format is a bencoding of a list.  The first element of the list is a
555
 
    string of the format signature, then each subsequent element is a list
556
 
    corresponding to a record.  Those lists contain:
557
 
 
558
 
      * a version id
559
 
      * a list of options
560
 
      * a list of parents
561
 
      * the bytes
562
 
 
563
 
    :returns: a bencoded list.
564
 
    """
565
 
    knit_stream = knit.get_data_stream(required_versions)
566
 
    format_signature, data_list, callable = knit_stream
567
 
    data = []
568
 
    data.append(format_signature)
569
 
    for version, options, length, parents in data_list:
570
 
        data.append([version, options, parents, callable(length)])
571
 
    return bencode.bencode(data)