/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/weaverepo.py

  • Committer: Andrew Bennetts
  • Date: 2008-03-12 20:13:07 UTC
  • mfrom: (3267 +trunk)
  • mto: This revision was merged to the branch mainline in revision 3756.
  • Revision ID: andrew.bennetts@canonical.com-20080312201307-ngd5bynt2nvhnlb7
Merge from bzr.dev.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2007-2010 Canonical Ltd
 
1
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""Deprecated weave-based repository formats.
18
18
 
20
20
ghosts.
21
21
"""
22
22
 
23
 
import os
24
 
from cStringIO import StringIO
25
 
import urllib
 
23
from StringIO import StringIO
26
24
 
27
25
from bzrlib.lazy_import import lazy_import
28
26
lazy_import(globals(), """
29
27
from bzrlib import (
30
28
    xml5,
31
 
    graph as _mod_graph,
32
29
    )
33
30
""")
34
31
from bzrlib import (
39
36
    lockdir,
40
37
    osutils,
41
38
    revision as _mod_revision,
42
 
    trace,
43
 
    urlutils,
44
 
    versionedfile,
45
39
    weave,
46
40
    weavefile,
47
41
    )
48
42
from bzrlib.decorators import needs_read_lock, needs_write_lock
49
43
from bzrlib.repository import (
50
44
    CommitBuilder,
51
 
    MetaDirVersionedFileRepository,
 
45
    MetaDirRepository,
52
46
    MetaDirRepositoryFormat,
53
47
    Repository,
54
48
    RepositoryFormat,
55
49
    )
56
50
from bzrlib.store.text import TextStore
57
 
from bzrlib.tuned_gzip import GzipFile, bytes_to_gzip
58
 
from bzrlib.versionedfile import (
59
 
    AbsentContentFactory,
60
 
    FulltextContentFactory,
61
 
    VersionedFiles,
62
 
    )
 
51
from bzrlib.trace import mutter
63
52
 
64
53
 
65
54
class AllInOneRepository(Repository):
69
58
    def _serializer(self):
70
59
        return xml5.serializer_v5
71
60
 
72
 
    def _escape(self, file_or_path):
73
 
        if not isinstance(file_or_path, basestring):
74
 
            file_or_path = '/'.join(file_or_path)
75
 
        if file_or_path == '':
76
 
            return u''
77
 
        return urlutils.escape(osutils.safe_unicode(file_or_path))
78
 
 
79
 
    def __init__(self, _format, a_bzrdir):
 
61
    def __init__(self, _format, a_bzrdir, _revision_store, control_store, text_store):
80
62
        # we reuse one control files instance.
81
 
        dir_mode = a_bzrdir._get_dir_mode()
82
 
        file_mode = a_bzrdir._get_file_mode()
 
63
        dir_mode = a_bzrdir._control_files._dir_mode
 
64
        file_mode = a_bzrdir._control_files._file_mode
83
65
 
84
66
        def get_store(name, compressed=True, prefixed=False):
85
67
            # FIXME: This approach of assuming stores are all entirely compressed
86
 
            # or entirely uncompressed is tidy, but breaks upgrade from
87
 
            # some existing branches where there's a mixture; we probably
 
68
            # or entirely uncompressed is tidy, but breaks upgrade from 
 
69
            # some existing branches where there's a mixture; we probably 
88
70
            # still want the option to look for both.
89
 
            relpath = self._escape(name)
90
 
            store = TextStore(a_bzrdir.transport.clone(relpath),
 
71
            relpath = a_bzrdir._control_files._escape(name)
 
72
            store = TextStore(a_bzrdir._control_files._transport.clone(relpath),
91
73
                              prefixed=prefixed, compressed=compressed,
92
74
                              dir_mode=dir_mode,
93
75
                              file_mode=file_mode)
94
76
            return store
95
77
 
96
78
        # not broken out yet because the controlweaves|inventory_store
97
 
        # and texts bits are still different.
 
79
        # and text_store | weave_store bits are still different.
98
80
        if isinstance(_format, RepositoryFormat4):
99
 
            # cannot remove these - there is still no consistent api
 
81
            # cannot remove these - there is still no consistent api 
100
82
            # which allows access to this old info.
101
83
            self.inventory_store = get_store('inventory-store')
102
 
            self._text_store = get_store('text-store')
103
 
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files)
 
84
            text_store = get_store('text-store')
 
85
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files, _revision_store, control_store, text_store)
104
86
 
105
87
    @needs_read_lock
106
88
    def _all_possible_ids(self):
107
89
        """Return all the possible revisions that we could find."""
108
90
        if 'evil' in debug.debug_flags:
109
 
            trace.mutter_callsite(
110
 
                3, "_all_possible_ids scales with size of history.")
111
 
        return [key[-1] for key in self.inventories.keys()]
 
91
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
92
        return self.get_inventory_weave().versions()
112
93
 
113
94
    @needs_read_lock
114
95
    def _all_revision_ids(self):
115
 
        """Returns a list of all the revision ids in the repository.
 
96
        """Returns a list of all the revision ids in the repository. 
116
97
 
117
 
        These are in as much topological order as the underlying store can
 
98
        These are in as much topological order as the underlying store can 
118
99
        present: for weaves ghosts may lead to a lack of correctness until
119
100
        the reweave updates the parents list.
120
101
        """
121
 
        return [key[-1] for key in self.revisions.keys()]
122
 
 
123
 
    def _activate_new_inventory(self):
124
 
        """Put a replacement inventory.new into use as inventories."""
125
 
        # Copy the content across
126
 
        t = self.bzrdir._control_files._transport
127
 
        t.copy('inventory.new.weave', 'inventory.weave')
128
 
        # delete the temp inventory
129
 
        t.delete('inventory.new.weave')
130
 
        # Check we can parse the new weave properly as a sanity check
131
 
        self.inventories.keys()
132
 
 
133
 
    def _backup_inventory(self):
134
 
        t = self.bzrdir._control_files._transport
135
 
        t.copy('inventory.weave', 'inventory.backup.weave')
136
 
 
137
 
    def _temp_inventories(self):
138
 
        t = self.bzrdir._control_files._transport
139
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
102
        if self._revision_store.text_store.listable():
 
103
            return self._revision_store.all_revision_ids(self.get_transaction())
 
104
        result = self._all_possible_ids()
 
105
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
106
        #       ids. (It should, since _revision_store's API should change to
 
107
        #       return utf8 revision_ids)
 
108
        return self._eliminate_revisions_not_present(result)
 
109
 
 
110
    def _check_revision_parents(self, revision, inventory):
 
111
        """Private to Repository and Fetch.
 
112
        
 
113
        This checks the parentage of revision in an inventory weave for 
 
114
        consistency and is only applicable to inventory-weave-for-ancestry
 
115
        using repository formats & fetchers.
 
116
        """
 
117
        weave_parents = inventory.get_parents(revision.revision_id)
 
118
        weave_names = inventory.versions()
 
119
        for parent_id in revision.parent_ids:
 
120
            if parent_id in weave_names:
 
121
                # this parent must not be a ghost.
 
122
                if not parent_id in weave_parents:
 
123
                    # but it is a ghost
 
124
                    raise errors.CorruptRepository(self)
140
125
 
141
126
    def get_commit_builder(self, branch, parents, config, timestamp=None,
142
127
                           timezone=None, committer=None, revprops=None,
143
128
                           revision_id=None):
144
129
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
145
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
130
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
146
131
                              committer, revprops, revision_id)
147
132
        self.start_write_group()
148
133
        return result
150
135
    @needs_read_lock
151
136
    def get_revisions(self, revision_ids):
152
137
        revs = self._get_revisions(revision_ids)
 
138
        # weave corruption can lead to absent revision markers that should be
 
139
        # present.
 
140
        # the following test is reasonably cheap (it needs a single weave read)
 
141
        # and the weave is cached in read transactions. In write transactions
 
142
        # it is not cached but typically we only read a small number of
 
143
        # revisions. For knits when they are introduced we will probably want
 
144
        # to ensure that caching write transactions are in use.
 
145
        inv = self.get_inventory_weave()
 
146
        for rev in revs:
 
147
            self._check_revision_parents(rev, inv)
153
148
        return revs
154
149
 
155
 
    def _inventory_add_lines(self, revision_id, parents, lines,
156
 
        check_content=True):
157
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
158
 
        present_parents = self.get_graph().get_parent_map(parents)
159
 
        final_parents = []
160
 
        for parent in parents:
161
 
            if parent in present_parents:
162
 
                final_parents.append((parent,))
163
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
164
 
            check_content=check_content)[0]
165
 
 
 
150
    @needs_read_lock
 
151
    def get_revision_graph(self, revision_id=None):
 
152
        """Return a dictionary containing the revision graph.
 
153
        
 
154
        :param revision_id: The revision_id to get a graph from. If None, then
 
155
        the entire revision graph is returned. This is a deprecated mode of
 
156
        operation and will be removed in the future.
 
157
        :return: a dictionary of revision_id->revision_parents_list.
 
158
        """
 
159
        if 'evil' in debug.debug_flags:
 
160
            mutter_callsite(2,
 
161
                "get_revision_graph scales with size of history.")
 
162
        # special case NULL_REVISION
 
163
        if revision_id == _mod_revision.NULL_REVISION:
 
164
            return {}
 
165
        a_weave = self.get_inventory_weave()
 
166
        all_revisions = self._eliminate_revisions_not_present(
 
167
                                a_weave.versions())
 
168
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
169
                             node in all_revisions])
 
170
        if revision_id is None:
 
171
            return entire_graph
 
172
        elif revision_id not in entire_graph:
 
173
            raise errors.NoSuchRevision(self, revision_id)
 
174
        else:
 
175
            # add what can be reached from revision_id
 
176
            result = {}
 
177
            pending = set([revision_id])
 
178
            while len(pending) > 0:
 
179
                node = pending.pop()
 
180
                result[node] = entire_graph[node]
 
181
                for revision_id in result[node]:
 
182
                    if revision_id not in result:
 
183
                        pending.add(revision_id)
 
184
            return result
 
185
 
 
186
    def has_revisions(self, revision_ids):
 
187
        """See Repository.has_revisions()."""
 
188
        result = set()
 
189
        transaction = self.get_transaction()
 
190
        for revision_id in revision_ids:
 
191
            if self._revision_store.has_revision_id(revision_id, transaction):
 
192
                result.add(revision_id)
 
193
        return result
 
194
 
 
195
    @needs_read_lock
166
196
    def is_shared(self):
167
197
        """AllInOne repositories cannot be shared."""
168
198
        return False
177
207
        :param new_value: True to restore the default, False to disable making
178
208
                          working trees.
179
209
        """
180
 
        raise errors.RepositoryUpgradeRequired(self.user_url)
181
 
 
 
210
        raise NotImplementedError(self.set_make_working_trees)
 
211
    
182
212
    def make_working_trees(self):
183
213
        """Returns the policy for making working trees on new branches."""
184
214
        return True
189
219
        return False
190
220
 
191
221
 
192
 
class WeaveMetaDirRepository(MetaDirVersionedFileRepository):
 
222
class WeaveMetaDirRepository(MetaDirRepository):
193
223
    """A subclass of MetaDirRepository to set weave specific policy."""
194
224
 
195
 
    def __init__(self, _format, a_bzrdir, control_files):
196
 
        super(WeaveMetaDirRepository, self).__init__(_format, a_bzrdir, control_files)
197
 
        self._serializer = _format._serializer
 
225
    @property
 
226
    def _serializer(self):
 
227
        return xml5.serializer_v5
198
228
 
199
229
    @needs_read_lock
200
230
    def _all_possible_ids(self):
201
231
        """Return all the possible revisions that we could find."""
202
232
        if 'evil' in debug.debug_flags:
203
 
            trace.mutter_callsite(
204
 
                3, "_all_possible_ids scales with size of history.")
205
 
        return [key[-1] for key in self.inventories.keys()]
 
233
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
234
        return self.get_inventory_weave().versions()
206
235
 
207
236
    @needs_read_lock
208
237
    def _all_revision_ids(self):
209
 
        """Returns a list of all the revision ids in the repository.
 
238
        """Returns a list of all the revision ids in the repository. 
210
239
 
211
 
        These are in as much topological order as the underlying store can
 
240
        These are in as much topological order as the underlying store can 
212
241
        present: for weaves ghosts may lead to a lack of correctness until
213
242
        the reweave updates the parents list.
214
243
        """
215
 
        return [key[-1] for key in self.revisions.keys()]
216
 
 
217
 
    def _activate_new_inventory(self):
218
 
        """Put a replacement inventory.new into use as inventories."""
219
 
        # Copy the content across
220
 
        t = self._transport
221
 
        t.copy('inventory.new.weave', 'inventory.weave')
222
 
        # delete the temp inventory
223
 
        t.delete('inventory.new.weave')
224
 
        # Check we can parse the new weave properly as a sanity check
225
 
        self.inventories.keys()
226
 
 
227
 
    def _backup_inventory(self):
228
 
        t = self._transport
229
 
        t.copy('inventory.weave', 'inventory.backup.weave')
230
 
 
231
 
    def _temp_inventories(self):
232
 
        t = self._transport
233
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
244
        if self._revision_store.text_store.listable():
 
245
            return self._revision_store.all_revision_ids(self.get_transaction())
 
246
        result = self._all_possible_ids()
 
247
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
248
        #       ids. (It should, since _revision_store's API should change to
 
249
        #       return utf8 revision_ids)
 
250
        return self._eliminate_revisions_not_present(result)
 
251
 
 
252
    def _check_revision_parents(self, revision, inventory):
 
253
        """Private to Repository and Fetch.
 
254
        
 
255
        This checks the parentage of revision in an inventory weave for 
 
256
        consistency and is only applicable to inventory-weave-for-ancestry
 
257
        using repository formats & fetchers.
 
258
        """
 
259
        weave_parents = inventory.get_parents(revision.revision_id)
 
260
        weave_names = inventory.versions()
 
261
        for parent_id in revision.parent_ids:
 
262
            if parent_id in weave_names:
 
263
                # this parent must not be a ghost.
 
264
                if not parent_id in weave_parents:
 
265
                    # but it is a ghost
 
266
                    raise errors.CorruptRepository(self)
234
267
 
235
268
    def get_commit_builder(self, branch, parents, config, timestamp=None,
236
269
                           timezone=None, committer=None, revprops=None,
237
270
                           revision_id=None):
238
271
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
239
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
272
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
240
273
                              committer, revprops, revision_id)
241
274
        self.start_write_group()
242
275
        return result
244
277
    @needs_read_lock
245
278
    def get_revision(self, revision_id):
246
279
        """Return the Revision object for a named revision"""
 
280
        # TODO: jam 20070210 get_revision_reconcile should do this for us
247
281
        r = self.get_revision_reconcile(revision_id)
 
282
        # weave corruption can lead to absent revision markers that should be
 
283
        # present.
 
284
        # the following test is reasonably cheap (it needs a single weave read)
 
285
        # and the weave is cached in read transactions. In write transactions
 
286
        # it is not cached but typically we only read a small number of
 
287
        # revisions. For knits when they are introduced we will probably want
 
288
        # to ensure that caching write transactions are in use.
 
289
        inv = self.get_inventory_weave()
 
290
        self._check_revision_parents(r, inv)
248
291
        return r
249
292
 
250
 
    def _inventory_add_lines(self, revision_id, parents, lines,
251
 
        check_content=True):
252
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
253
 
        present_parents = self.get_graph().get_parent_map(parents)
254
 
        final_parents = []
255
 
        for parent in parents:
256
 
            if parent in present_parents:
257
 
                final_parents.append((parent,))
258
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
259
 
            check_content=check_content)[0]
 
293
    @needs_read_lock
 
294
    def get_revision_graph(self, revision_id=None):
 
295
        """Return a dictionary containing the revision graph.
 
296
        
 
297
        :param revision_id: The revision_id to get a graph from. If None, then
 
298
        the entire revision graph is returned. This is a deprecated mode of
 
299
        operation and will be removed in the future.
 
300
        :return: a dictionary of revision_id->revision_parents_list.
 
301
        """
 
302
        if 'evil' in debug.debug_flags:
 
303
            mutter_callsite(3,
 
304
                "get_revision_graph scales with size of history.")
 
305
        # special case NULL_REVISION
 
306
        if revision_id == _mod_revision.NULL_REVISION:
 
307
            return {}
 
308
        a_weave = self.get_inventory_weave()
 
309
        all_revisions = self._eliminate_revisions_not_present(
 
310
                                a_weave.versions())
 
311
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
312
                             node in all_revisions])
 
313
        if revision_id is None:
 
314
            return entire_graph
 
315
        elif revision_id not in entire_graph:
 
316
            raise errors.NoSuchRevision(self, revision_id)
 
317
        else:
 
318
            # add what can be reached from revision_id
 
319
            result = {}
 
320
            pending = set([revision_id])
 
321
            while len(pending) > 0:
 
322
                node = pending.pop()
 
323
                result[node] = entire_graph[node]
 
324
                for revision_id in result[node]:
 
325
                    if revision_id not in result:
 
326
                        pending.add(revision_id)
 
327
            return result
 
328
 
 
329
    def has_revisions(self, revision_ids):
 
330
        """See Repository.has_revisions()."""
 
331
        result = set()
 
332
        transaction = self.get_transaction()
 
333
        for revision_id in revision_ids:
 
334
            if self._revision_store.has_revision_id(revision_id, transaction):
 
335
                result.add(revision_id)
 
336
        return result
260
337
 
261
338
    def revision_graph_can_have_wrong_parents(self):
 
339
        # XXX: This is an old format that we don't support full checking on, so
 
340
        # just claim that checking for this inconsistency is not required.
262
341
        return False
263
342
 
264
343
 
269
348
    supports_tree_reference = False
270
349
    supports_ghosts = False
271
350
    supports_external_lookups = False
272
 
    supports_chks = False
273
 
    _fetch_order = 'topological'
274
 
    _fetch_reconcile = True
275
 
    fast_deltas = False
276
351
 
277
352
    def initialize(self, a_bzrdir, shared=False, _internal=False):
278
353
        """Create a weave repository."""
282
357
        if not _internal:
283
358
            # always initialized when the bzrdir is.
284
359
            return self.open(a_bzrdir, _found=True)
285
 
 
 
360
        
286
361
        # Create an empty weave
287
362
        sio = StringIO()
288
363
        weavefile.write_weave_v5(weave.Weave(), sio)
289
364
        empty_weave = sio.getvalue()
290
365
 
291
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
292
 
 
 
366
        mutter('creating repository in %s.', a_bzrdir.transport.base)
 
367
        dirs = ['revision-store', 'weaves']
 
368
        files = [('inventory.weave', StringIO(empty_weave)),
 
369
                 ]
 
370
        
293
371
        # FIXME: RBC 20060125 don't peek under the covers
294
372
        # NB: no need to escape relative paths that are url safe.
295
373
        control_files = lockable_files.LockableFiles(a_bzrdir.transport,
296
 
            'branch-lock', lockable_files.TransportLock)
 
374
                                'branch-lock', lockable_files.TransportLock)
297
375
        control_files.create_lock()
298
376
        control_files.lock_write()
299
 
        transport = a_bzrdir.transport
 
377
        control_files._transport.mkdir_multi(dirs,
 
378
                mode=control_files._dir_mode)
300
379
        try:
301
 
            transport.mkdir_multi(['revision-store', 'weaves'],
302
 
                mode=a_bzrdir._get_dir_mode())
303
 
            transport.put_bytes_non_atomic('inventory.weave', empty_weave,
304
 
                mode=a_bzrdir._get_file_mode())
 
380
            for file, content in files:
 
381
                control_files.put(file, content)
305
382
        finally:
306
383
            control_files.unlock()
307
 
        repository = self.open(a_bzrdir, _found=True)
308
 
        self._run_post_repo_init_hooks(repository, a_bzrdir, shared)
309
 
        return repository
 
384
        return self.open(a_bzrdir, _found=True)
 
385
 
 
386
    def _get_control_store(self, repo_transport, control_files):
 
387
        """Return the control store for this repository."""
 
388
        return self._get_versioned_file_store('',
 
389
                                              repo_transport,
 
390
                                              control_files,
 
391
                                              prefixed=False)
 
392
 
 
393
    def _get_text_store(self, transport, control_files):
 
394
        """Get a store for file texts for this format."""
 
395
        raise NotImplementedError(self._get_text_store)
310
396
 
311
397
    def open(self, a_bzrdir, _found=False):
312
398
        """See RepositoryFormat.open()."""
316
402
 
317
403
        repo_transport = a_bzrdir.get_repository_transport(None)
318
404
        control_files = a_bzrdir._control_files
319
 
        result = AllInOneRepository(_format=self, a_bzrdir=a_bzrdir)
320
 
        result.revisions = self._get_revisions(repo_transport, result)
321
 
        result.signatures = self._get_signatures(repo_transport, result)
322
 
        result.inventories = self._get_inventories(repo_transport, result)
323
 
        result.texts = self._get_texts(repo_transport, result)
324
 
        result.chk_bytes = None
325
 
        return result
 
405
        text_store = self._get_text_store(repo_transport, control_files)
 
406
        control_store = self._get_control_store(repo_transport, control_files)
 
407
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
408
        return AllInOneRepository(_format=self,
 
409
                                  a_bzrdir=a_bzrdir,
 
410
                                  _revision_store=_revision_store,
 
411
                                  control_store=control_store,
 
412
                                  text_store=text_store)
 
413
 
 
414
    def check_conversion_target(self, target_format):
 
415
        pass
326
416
 
327
417
 
328
418
class RepositoryFormat4(PreSplitOutRepositoryFormat):
339
429
 
340
430
    _matchingbzrdir = bzrdir.BzrDirFormat4()
341
431
 
 
432
    def __init__(self):
 
433
        super(RepositoryFormat4, self).__init__()
 
434
 
342
435
    def get_format_description(self):
343
436
        """See RepositoryFormat.get_format_description()."""
344
437
        return "Repository format 4"
351
444
        """Format 4 is not supported.
352
445
 
353
446
        It is not supported because the model changed from 4 to 5 and the
354
 
        conversion logic is expensive - so doing it on the fly was not
 
447
        conversion logic is expensive - so doing it on the fly was not 
355
448
        feasible.
356
449
        """
357
450
        return False
358
451
 
359
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
360
 
        # No inventories store written so far.
 
452
    def _get_control_store(self, repo_transport, control_files):
 
453
        """Format 4 repositories have no formal control store at this point.
 
454
        
 
455
        This will cause any control-file-needing apis to fail - this is desired.
 
456
        """
361
457
        return None
362
 
 
363
 
    def _get_revisions(self, repo_transport, repo):
 
458
    
 
459
    def _get_revision_store(self, repo_transport, control_files):
 
460
        """See RepositoryFormat._get_revision_store()."""
364
461
        from bzrlib.xml4 import serializer_v4
365
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
366
 
            serializer_v4, True, versionedfile.PrefixMapper(),
367
 
            repo.is_locked, repo.is_write_locked)
368
 
 
369
 
    def _get_signatures(self, repo_transport, repo):
370
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
371
 
            False, versionedfile.PrefixMapper(),
372
 
            repo.is_locked, repo.is_write_locked)
373
 
 
374
 
    def _get_texts(self, repo_transport, repo):
375
 
        return None
 
462
        return self._get_text_rev_store(repo_transport,
 
463
                                        control_files,
 
464
                                        'revision-store',
 
465
                                        serializer=serializer_v4)
 
466
 
 
467
    def _get_text_store(self, transport, control_files):
 
468
        """See RepositoryFormat._get_text_store()."""
376
469
 
377
470
 
378
471
class RepositoryFormat5(PreSplitOutRepositoryFormat):
386
479
 
387
480
    _versionedfile_class = weave.WeaveFile
388
481
    _matchingbzrdir = bzrdir.BzrDirFormat5()
389
 
    @property
390
 
    def _serializer(self):
391
 
        return xml5.serializer_v5
 
482
 
 
483
    def __init__(self):
 
484
        super(RepositoryFormat5, self).__init__()
392
485
 
393
486
    def get_format_description(self):
394
487
        """See RepositoryFormat.get_format_description()."""
395
488
        return "Weave repository format 5"
396
489
 
397
 
    def network_name(self):
398
 
        """The network name for this format is the control dirs disk label."""
399
 
        return self._matchingbzrdir.get_format_string()
400
 
 
401
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
402
 
        mapper = versionedfile.ConstantMapper(name)
403
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
404
 
            weave.WeaveFile, mapper, repo.is_locked)
405
 
 
406
 
    def _get_revisions(self, repo_transport, repo):
407
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
408
 
            xml5.serializer_v5, False, versionedfile.PrefixMapper(),
409
 
            repo.is_locked, repo.is_write_locked)
410
 
 
411
 
    def _get_signatures(self, repo_transport, repo):
412
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
413
 
            False, versionedfile.PrefixMapper(),
414
 
            repo.is_locked, repo.is_write_locked)
415
 
 
416
 
    def _get_texts(self, repo_transport, repo):
417
 
        mapper = versionedfile.PrefixMapper()
418
 
        base_transport = repo_transport.clone('weaves')
419
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
420
 
            weave.WeaveFile, mapper, repo.is_locked)
 
490
    def _get_revision_store(self, repo_transport, control_files):
 
491
        """See RepositoryFormat._get_revision_store()."""
 
492
        """Return the revision store object for this a_bzrdir."""
 
493
        return self._get_text_rev_store(repo_transport,
 
494
                                        control_files,
 
495
                                        'revision-store',
 
496
                                        compressed=False)
 
497
 
 
498
    def _get_text_store(self, transport, control_files):
 
499
        """See RepositoryFormat._get_text_store()."""
 
500
        return self._get_versioned_file_store('weaves', transport, control_files, prefixed=False)
421
501
 
422
502
 
423
503
class RepositoryFormat6(PreSplitOutRepositoryFormat):
431
511
 
432
512
    _versionedfile_class = weave.WeaveFile
433
513
    _matchingbzrdir = bzrdir.BzrDirFormat6()
434
 
    @property
435
 
    def _serializer(self):
436
 
        return xml5.serializer_v5
 
514
 
 
515
    def __init__(self):
 
516
        super(RepositoryFormat6, self).__init__()
437
517
 
438
518
    def get_format_description(self):
439
519
        """See RepositoryFormat.get_format_description()."""
440
520
        return "Weave repository format 6"
441
521
 
442
 
    def network_name(self):
443
 
        """The network name for this format is the control dirs disk label."""
444
 
        return self._matchingbzrdir.get_format_string()
445
 
 
446
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
447
 
        mapper = versionedfile.ConstantMapper(name)
448
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
449
 
            weave.WeaveFile, mapper, repo.is_locked)
450
 
 
451
 
    def _get_revisions(self, repo_transport, repo):
452
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
453
 
            xml5.serializer_v5, False, versionedfile.HashPrefixMapper(),
454
 
            repo.is_locked, repo.is_write_locked)
455
 
 
456
 
    def _get_signatures(self, repo_transport, repo):
457
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
458
 
            False, versionedfile.HashPrefixMapper(),
459
 
            repo.is_locked, repo.is_write_locked)
460
 
 
461
 
    def _get_texts(self, repo_transport, repo):
462
 
        mapper = versionedfile.HashPrefixMapper()
463
 
        base_transport = repo_transport.clone('weaves')
464
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
465
 
            weave.WeaveFile, mapper, repo.is_locked)
466
 
 
 
522
    def _get_revision_store(self, repo_transport, control_files):
 
523
        """See RepositoryFormat._get_revision_store()."""
 
524
        return self._get_text_rev_store(repo_transport,
 
525
                                        control_files,
 
526
                                        'revision-store',
 
527
                                        compressed=False,
 
528
                                        prefixed=True)
 
529
 
 
530
    def _get_text_store(self, transport, control_files):
 
531
        """See RepositoryFormat._get_text_store()."""
 
532
        return self._get_versioned_file_store('weaves', transport, control_files)
467
533
 
468
534
class RepositoryFormat7(MetaDirRepositoryFormat):
469
535
    """Bzr repository 7.
479
545
 
480
546
    _versionedfile_class = weave.WeaveFile
481
547
    supports_ghosts = False
482
 
    supports_chks = False
483
548
 
484
 
    _fetch_order = 'topological'
485
 
    _fetch_reconcile = True
486
 
    fast_deltas = False
487
 
    @property
488
 
    def _serializer(self):
489
 
        return xml5.serializer_v5
 
549
    def _get_control_store(self, repo_transport, control_files):
 
550
        """Return the control store for this repository."""
 
551
        return self._get_versioned_file_store('',
 
552
                                              repo_transport,
 
553
                                              control_files,
 
554
                                              prefixed=False)
490
555
 
491
556
    def get_format_string(self):
492
557
        """See RepositoryFormat.get_format_string()."""
496
561
        """See RepositoryFormat.get_format_description()."""
497
562
        return "Weave repository format 7"
498
563
 
499
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
500
 
        mapper = versionedfile.ConstantMapper(name)
501
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
502
 
            weave.WeaveFile, mapper, repo.is_locked)
503
 
 
504
 
    def _get_revisions(self, repo_transport, repo):
505
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
506
 
            xml5.serializer_v5, True, versionedfile.HashPrefixMapper(),
507
 
            repo.is_locked, repo.is_write_locked)
508
 
 
509
 
    def _get_signatures(self, repo_transport, repo):
510
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
511
 
            True, versionedfile.HashPrefixMapper(),
512
 
            repo.is_locked, repo.is_write_locked)
513
 
 
514
 
    def _get_texts(self, repo_transport, repo):
515
 
        mapper = versionedfile.HashPrefixMapper()
516
 
        base_transport = repo_transport.clone('weaves')
517
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
518
 
            weave.WeaveFile, mapper, repo.is_locked)
 
564
    def check_conversion_target(self, target_format):
 
565
        pass
 
566
 
 
567
    def _get_revision_store(self, repo_transport, control_files):
 
568
        """See RepositoryFormat._get_revision_store()."""
 
569
        return self._get_text_rev_store(repo_transport,
 
570
                                        control_files,
 
571
                                        'revision-store',
 
572
                                        compressed=False,
 
573
                                        prefixed=True,
 
574
                                        )
 
575
 
 
576
    def _get_text_store(self, transport, control_files):
 
577
        """See RepositoryFormat._get_text_store()."""
 
578
        return self._get_versioned_file_store('weaves',
 
579
                                              transport,
 
580
                                              control_files)
519
581
 
520
582
    def initialize(self, a_bzrdir, shared=False):
521
583
        """Create a weave repository.
528
590
        weavefile.write_weave_v5(weave.Weave(), sio)
529
591
        empty_weave = sio.getvalue()
530
592
 
531
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
 
593
        mutter('creating repository in %s.', a_bzrdir.transport.base)
532
594
        dirs = ['revision-store', 'weaves']
533
 
        files = [('inventory.weave', StringIO(empty_weave)),
 
595
        files = [('inventory.weave', StringIO(empty_weave)), 
534
596
                 ]
535
597
        utf8_files = [('format', self.get_format_string())]
536
 
 
 
598
 
537
599
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
538
600
        return self.open(a_bzrdir=a_bzrdir, _found=True)
539
601
 
540
602
    def open(self, a_bzrdir, _found=False, _override_transport=None):
541
603
        """See RepositoryFormat.open().
542
 
 
 
604
        
543
605
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
544
606
                                    repository at a slightly different url
545
607
                                    than normal. I.e. during 'upgrade'.
546
608
        """
547
609
        if not _found:
548
610
            format = RepositoryFormat.find_format(a_bzrdir)
 
611
            assert format.__class__ ==  self.__class__
549
612
        if _override_transport is not None:
550
613
            repo_transport = _override_transport
551
614
        else:
552
615
            repo_transport = a_bzrdir.get_repository_transport(None)
553
616
        control_files = lockable_files.LockableFiles(repo_transport,
554
617
                                'lock', lockdir.LockDir)
555
 
        result = WeaveMetaDirRepository(_format=self, a_bzrdir=a_bzrdir,
556
 
            control_files=control_files)
557
 
        result.revisions = self._get_revisions(repo_transport, result)
558
 
        result.signatures = self._get_signatures(repo_transport, result)
559
 
        result.inventories = self._get_inventories(repo_transport, result)
560
 
        result.texts = self._get_texts(repo_transport, result)
561
 
        result.chk_bytes = None
562
 
        result._transport = repo_transport
563
 
        return result
564
 
 
565
 
 
566
 
class TextVersionedFiles(VersionedFiles):
567
 
    """Just-a-bunch-of-files based VersionedFile stores."""
568
 
 
569
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
570
 
        self._compressed = compressed
571
 
        self._transport = transport
572
 
        self._mapper = mapper
573
 
        if self._compressed:
574
 
            self._ext = '.gz'
575
 
        else:
576
 
            self._ext = ''
577
 
        self._is_locked = is_locked
578
 
        self._can_write = can_write
579
 
 
580
 
    def add_lines(self, key, parents, lines):
581
 
        """Add a revision to the store."""
582
 
        if not self._is_locked():
583
 
            raise errors.ObjectNotLocked(self)
584
 
        if not self._can_write():
585
 
            raise errors.ReadOnlyError(self)
586
 
        if '/' in key[-1]:
587
 
            raise ValueError('bad idea to put / in %r' % (key,))
588
 
        text = ''.join(lines)
589
 
        if self._compressed:
590
 
            text = bytes_to_gzip(text)
591
 
        path = self._map(key)
592
 
        self._transport.put_bytes_non_atomic(path, text, create_parent_dir=True)
593
 
 
594
 
    def insert_record_stream(self, stream):
595
 
        adapters = {}
596
 
        for record in stream:
597
 
            # Raise an error when a record is missing.
598
 
            if record.storage_kind == 'absent':
599
 
                raise errors.RevisionNotPresent([record.key[0]], self)
600
 
            # adapt to non-tuple interface
601
 
            if record.storage_kind == 'fulltext':
602
 
                self.add_lines(record.key, None,
603
 
                    osutils.split_lines(record.get_bytes_as('fulltext')))
604
 
            else:
605
 
                adapter_key = record.storage_kind, 'fulltext'
606
 
                try:
607
 
                    adapter = adapters[adapter_key]
608
 
                except KeyError:
609
 
                    adapter_factory = adapter_registry.get(adapter_key)
610
 
                    adapter = adapter_factory(self)
611
 
                    adapters[adapter_key] = adapter
612
 
                lines = osutils.split_lines(adapter.get_bytes(
613
 
                    record, record.get_bytes_as(record.storage_kind)))
614
 
                try:
615
 
                    self.add_lines(record.key, None, lines)
616
 
                except RevisionAlreadyPresent:
617
 
                    pass
618
 
 
619
 
    def _load_text(self, key):
620
 
        if not self._is_locked():
621
 
            raise errors.ObjectNotLocked(self)
622
 
        path = self._map(key)
623
 
        try:
624
 
            text = self._transport.get_bytes(path)
625
 
            compressed = self._compressed
626
 
        except errors.NoSuchFile:
627
 
            if self._compressed:
628
 
                # try without the .gz
629
 
                path = path[:-3]
630
 
                try:
631
 
                    text = self._transport.get_bytes(path)
632
 
                    compressed = False
633
 
                except errors.NoSuchFile:
634
 
                    return None
635
 
            else:
636
 
                return None
637
 
        if compressed:
638
 
            text = GzipFile(mode='rb', fileobj=StringIO(text)).read()
639
 
        return text
640
 
 
641
 
    def _map(self, key):
642
 
        return self._mapper.map(key) + self._ext
643
 
 
644
 
 
645
 
class RevisionTextStore(TextVersionedFiles):
646
 
    """Legacy thunk for format 4 repositories."""
647
 
 
648
 
    def __init__(self, transport, serializer, compressed, mapper, is_locked,
649
 
        can_write):
650
 
        """Create a RevisionTextStore at transport with serializer."""
651
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
652
 
            is_locked, can_write)
653
 
        self._serializer = serializer
654
 
 
655
 
    def _load_text_parents(self, key):
656
 
        text = self._load_text(key)
657
 
        if text is None:
658
 
            return None, None
659
 
        parents = self._serializer.read_revision_from_string(text).parent_ids
660
 
        return text, tuple((parent,) for parent in parents)
661
 
 
662
 
    def get_parent_map(self, keys):
663
 
        result = {}
664
 
        for key in keys:
665
 
            parents = self._load_text_parents(key)[1]
666
 
            if parents is None:
667
 
                continue
668
 
            result[key] = parents
669
 
        return result
670
 
 
671
 
    def get_known_graph_ancestry(self, keys):
672
 
        """Get a KnownGraph instance with the ancestry of keys."""
673
 
        keys = self.keys()
674
 
        parent_map = self.get_parent_map(keys)
675
 
        kg = _mod_graph.KnownGraph(parent_map)
676
 
        return kg
677
 
 
678
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
679
 
        for key in keys:
680
 
            text, parents = self._load_text_parents(key)
681
 
            if text is None:
682
 
                yield AbsentContentFactory(key)
683
 
            else:
684
 
                yield FulltextContentFactory(key, parents, None, text)
685
 
 
686
 
    def keys(self):
687
 
        if not self._is_locked():
688
 
            raise errors.ObjectNotLocked(self)
689
 
        relpaths = set()
690
 
        for quoted_relpath in self._transport.iter_files_recursive():
691
 
            relpath = urllib.unquote(quoted_relpath)
692
 
            path, ext = os.path.splitext(relpath)
693
 
            if ext == '.gz':
694
 
                relpath = path
695
 
            if not relpath.endswith('.sig'):
696
 
                relpaths.add(relpath)
697
 
        paths = list(relpaths)
698
 
        return set([self._mapper.unmap(path) for path in paths])
699
 
 
700
 
 
701
 
class SignatureTextStore(TextVersionedFiles):
702
 
    """Legacy thunk for format 4-7 repositories."""
703
 
 
704
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
705
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
706
 
            is_locked, can_write)
707
 
        self._ext = '.sig' + self._ext
708
 
 
709
 
    def get_parent_map(self, keys):
710
 
        result = {}
711
 
        for key in keys:
712
 
            text = self._load_text(key)
713
 
            if text is None:
714
 
                continue
715
 
            result[key] = None
716
 
        return result
717
 
 
718
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
719
 
        for key in keys:
720
 
            text = self._load_text(key)
721
 
            if text is None:
722
 
                yield AbsentContentFactory(key)
723
 
            else:
724
 
                yield FulltextContentFactory(key, None, None, text)
725
 
 
726
 
    def keys(self):
727
 
        if not self._is_locked():
728
 
            raise errors.ObjectNotLocked(self)
729
 
        relpaths = set()
730
 
        for quoted_relpath in self._transport.iter_files_recursive():
731
 
            relpath = urllib.unquote(quoted_relpath)
732
 
            path, ext = os.path.splitext(relpath)
733
 
            if ext == '.gz':
734
 
                relpath = path
735
 
            if not relpath.endswith('.sig'):
736
 
                continue
737
 
            relpaths.add(relpath[:-4])
738
 
        paths = list(relpaths)
739
 
        return set([self._mapper.unmap(path) for path in paths])
 
618
        text_store = self._get_text_store(repo_transport, control_files)
 
619
        control_store = self._get_control_store(repo_transport, control_files)
 
620
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
621
        return WeaveMetaDirRepository(_format=self,
 
622
            a_bzrdir=a_bzrdir,
 
623
            control_files=control_files,
 
624
            _revision_store=_revision_store,
 
625
            control_store=control_store,
 
626
            text_store=text_store)
 
627
 
 
628
 
 
629
class WeaveCommitBuilder(CommitBuilder):
 
630
    """A builder for weave based repos that don't support ghosts."""
 
631
 
 
632
    def _add_text_to_weave(self, file_id, new_lines, parents, nostore_sha):
 
633
        versionedfile = self.repository.weave_store.get_weave_or_empty(
 
634
            file_id, self.repository.get_transaction())
 
635
        result = versionedfile.add_lines(
 
636
            self._new_revision_id, parents, new_lines,
 
637
            nostore_sha=nostore_sha)[0:2]
 
638
        versionedfile.clear_cache()
 
639
        return result
 
640
 
740
641
 
741
642
_legacy_formats = [RepositoryFormat4(),
742
643
                   RepositoryFormat5(),