/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to fetch.py

Fix formatting, remove catch-all for exceptions when opening local repositories.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2008 Jelmer Vernooij <jelmer@samba.org>
 
1
# Copyright (C) 2008 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
from cStringIO import (
18
 
    StringIO,
19
 
    )
20
 
import dulwich as git
21
 
from dulwich.client import (
22
 
    SimpleFetchGraphWalker,
23
 
    )
24
 
from dulwich.objects import (
25
 
    Commit,
26
 
    Tag,
27
 
    )
28
 
 
29
 
from bzrlib import (
30
 
    osutils,
31
 
    trace,
32
 
    ui,
33
 
    urlutils,
34
 
    )
35
 
from bzrlib.errors import (
36
 
    InvalidRevisionId,
37
 
    NoSuchRevision,
38
 
    )
39
 
from bzrlib.inventory import (
40
 
    Inventory,
41
 
    InventoryDirectory,
42
 
    InventoryFile,
43
 
    InventoryLink,
44
 
    )
45
 
from bzrlib.lru_cache import (
46
 
    LRUCache,
47
 
    )
48
 
from bzrlib.repository import (
49
 
    InterRepository,
50
 
    )
51
 
from bzrlib.revision import (
52
 
    NULL_REVISION,
53
 
    )
54
 
from bzrlib.tsort import (
55
 
    topo_sort,
56
 
    )
57
 
 
58
 
from bzrlib.plugins.git.converter import (
59
 
    BazaarObjectStore,
60
 
    )
61
 
from bzrlib.plugins.git.repository import (
62
 
    LocalGitRepository, 
63
 
    GitRepository, 
64
 
    GitRepositoryFormat,
65
 
    )
66
 
from bzrlib.plugins.git.remote import (
67
 
    RemoteGitRepository,
68
 
    )
 
17
from bzrlib import osutils
 
18
from bzrlib.errors import InvalidRevisionId
 
19
from bzrlib.inventory import Inventory
 
20
from bzrlib.repository import InterRepository
 
21
from bzrlib.trace import info
 
22
 
 
23
from bzrlib.plugins.git import git
 
24
from bzrlib.plugins.git.repository import LocalGitRepository, GitRepository, GitFormat
 
25
from bzrlib.plugins.git.remote import RemoteGitRepository
 
26
 
 
27
from dulwich.objects import Commit
 
28
 
 
29
from cStringIO import StringIO
69
30
 
70
31
 
71
32
class BzrFetchGraphWalker(object):
72
 
    """GraphWalker implementation that uses a Bazaar repository."""
73
33
 
74
34
    def __init__(self, repository, mapping):
75
35
        self.repository = repository
78
38
        self.heads = set(repository.all_revision_ids())
79
39
        self.parents = {}
80
40
 
81
 
    def __iter__(self):
82
 
        return iter(self.next, None)
83
 
 
84
41
    def ack(self, sha):
85
42
        revid = self.mapping.revision_id_foreign_to_bzr(sha)
86
43
        self.remove(revid)
87
44
 
88
45
    def remove(self, revid):
89
46
        self.done.add(revid)
90
 
        if revid in self.heads:
 
47
        if ref in self.heads:
91
48
            self.heads.remove(revid)
92
49
        if revid in self.parents:
93
50
            for p in self.parents[revid]:
101
58
            self.heads.update([p for p in ps if not p in self.done])
102
59
            try:
103
60
                self.done.add(ret)
104
 
                return self.mapping.revision_id_bzr_to_foreign(ret)[0]
 
61
                return self.mapping.revision_id_bzr_to_foreign(ret)
105
62
            except InvalidRevisionId:
106
63
                pass
107
64
        return None
108
65
 
109
66
 
110
 
def import_git_blob(texts, mapping, path, hexsha, base_inv, parent_id, 
111
 
    revision_id, parent_invs, shagitmap, lookup_object, executable, symlink):
 
67
def import_git_blob(repo, mapping, path, blob):
112
68
    """Import a git blob object into a bzr repository.
113
69
 
114
 
    :param texts: VersionedFiles to add to
 
70
    :param repo: bzr repository
115
71
    :param path: Path in the tree
116
72
    :param blob: A git blob
117
 
    :return: Inventory delta for this file
118
73
    """
119
74
    file_id = mapping.generate_file_id(path)
120
 
    if symlink:
121
 
        cls = InventoryLink
122
 
    else:
123
 
        cls = InventoryFile
124
 
    # We just have to hope this is indeed utf-8:
125
 
    ie = cls(file_id, urlutils.basename(path).decode("utf-8"), 
126
 
                parent_id)
127
 
    ie.executable = executable
128
 
    # See if this has changed at all
129
 
    try:
130
 
        base_sha = shagitmap.lookup_blob(file_id, base_inv.revision_id)
131
 
    except KeyError:
132
 
        base_sha = None
133
 
    else:
134
 
        if (base_sha == hexsha and base_inv[file_id].executable == ie.executable
135
 
            and base_inv[file_id].kind == ie.kind):
136
 
            # If nothing has changed since the base revision, we're done
137
 
            return []
138
 
    if base_sha == hexsha:
139
 
        ie.text_size = base_inv[file_id].text_size
140
 
        ie.text_sha1 = base_inv[file_id].text_sha1
141
 
        ie.symlink_target = base_inv[file_id].symlink_target
142
 
        ie.revision = base_inv[file_id].revision
143
 
    else:
144
 
        blob = lookup_object(hexsha)
145
 
        if ie.kind == "symlink":
146
 
            ie.symlink_target = blob.data
147
 
            ie.text_size = None
148
 
            ie.text_sha1 = None
149
 
        else:
150
 
            ie.text_size = len(blob.data)
151
 
            ie.text_sha1 = osutils.sha_string(blob.data)
152
 
    # Check what revision we should store
153
 
    parent_keys = []
154
 
    for pinv in parent_invs:
155
 
        if not file_id in pinv:
156
 
            continue
157
 
        if pinv[file_id].text_sha1 == ie.text_sha1:
158
 
            # found a revision in one of the parents to use
159
 
            ie.revision = pinv[file_id].revision
160
 
            break
161
 
        parent_keys.append((file_id, pinv[file_id].revision))
162
 
    if ie.revision is None:
163
 
        # Need to store a new revision
164
 
        ie.revision = revision_id
165
 
        assert file_id is not None
166
 
        assert ie.revision is not None
167
 
        texts.add_lines((file_id, ie.revision), parent_keys,
168
 
            osutils.split_lines(blob.data))
169
 
        shagitmap.add_entry(hexsha, "blob", (ie.file_id, ie.revision))
170
 
    if file_id in base_inv:
171
 
        old_path = base_inv.id2path(file_id)
172
 
    else:
173
 
        old_path = None
174
 
    return [(old_path, path, file_id, ie)]
175
 
 
176
 
 
177
 
def import_git_tree(texts, mapping, path, hexsha, base_inv, parent_id, 
178
 
    revision_id, parent_invs, shagitmap, lookup_object):
 
75
    repo.texts.add_lines((file_id, blob.id),
 
76
        [], #FIXME 
 
77
        osutils.split_lines(blob.data))
 
78
    inv.add_path(path, "file", file_id)
 
79
 
 
80
 
 
81
def import_git_tree(repo, mapping, path, tree, inv, lookup_object):
179
82
    """Import a git tree object into a bzr repository.
180
83
 
181
 
    :param texts: VersionedFiles object to add to
 
84
    :param repo: A Bzr repository object
182
85
    :param path: Path in the tree
183
86
    :param tree: A git tree object
184
 
    :param base_inv: Base inventory against which to return inventory delta
185
 
    :return: Inventory delta for this subtree
 
87
    :param inv: Inventory object
186
88
    """
187
 
    ret = []
188
89
    file_id = mapping.generate_file_id(path)
189
 
    # We just have to hope this is indeed utf-8:
190
 
    ie = InventoryDirectory(file_id, urlutils.basename(path.decode("utf-8")), 
191
 
        parent_id)
192
 
    if not file_id in base_inv:
193
 
        # Newly appeared here
194
 
        ie.revision = revision_id
195
 
        texts.add_lines((file_id, ie.revision), [], [])
196
 
        ret.append((None, path, file_id, ie))
197
 
    else:
198
 
        # See if this has changed at all
199
 
        try:
200
 
            base_sha = shagitmap.lookup_tree(path, base_inv.revision_id)
201
 
        except KeyError:
202
 
            pass
203
 
        else:
204
 
            if base_sha == hexsha:
205
 
                # If nothing has changed since the base revision, we're done
206
 
                return []
207
 
    # Remember for next time
208
 
    existing_children = set()
209
 
    shagitmap.add_entry(hexsha, "tree", (file_id, revision_id))
210
 
    tree = lookup_object(hexsha)
 
90
    repo.texts.add_lines((file_id, tree.id),
 
91
        [], #FIXME 
 
92
        [])
 
93
    inv.add_path(path, "directory", file_id)
211
94
    for mode, name, hexsha in tree.entries():
212
95
        entry_kind = (mode & 0700000) / 0100000
213
96
        basename = name.decode("utf-8")
214
 
        existing_children.add(basename)
215
97
        if path == "":
216
98
            child_path = name
217
99
        else:
218
100
            child_path = urlutils.join(path, name)
219
101
        if entry_kind == 0:
220
 
            ret.extend(import_git_tree(texts, mapping, child_path, hexsha, base_inv, 
221
 
                file_id, revision_id, parent_invs, shagitmap, lookup_object))
 
102
            import_git_tree(repo, mapping, child_path, lookup_object, inv)
222
103
        elif entry_kind == 1:
223
 
            fs_mode = mode & 0777
224
 
            file_kind = (mode & 070000) / 010000
225
 
            if file_kind == 0: # regular file
226
 
                symlink = False
227
 
            elif file_kind == 2:
228
 
                symlink = True
229
 
            else:
230
 
                raise AssertionError("Unknown file kind, mode=%r" % (mode,))
231
 
            ret.extend(import_git_blob(texts, mapping, child_path, hexsha, base_inv, 
232
 
                file_id, revision_id, parent_invs, shagitmap, lookup_object,
233
 
                bool(fs_mode & 0111), symlink))
 
104
            import_git_blob(repo, mapping, child_path, lookup_object, inv)
234
105
        else:
235
 
            raise AssertionError("Unknown object kind, perms=%r." % (mode,))
236
 
    # Remove any children that have disappeared
237
 
    if file_id in base_inv:
238
 
        deletable = [v for k,v in base_inv[file_id].children.iteritems() if k not in existing_children]
239
 
        while deletable:
240
 
            ie = deletable.pop()
241
 
            ret.append((base_inv.id2path(ie.file_id), None, ie.file_id, None))
242
 
            if ie.kind == "directory":
243
 
                deletable.extend(ie.children.values())
244
 
    return ret
245
 
 
246
 
 
247
 
def import_git_objects(repo, mapping, object_iter, target_git_object_retriever, 
248
 
        heads, pb=None):
 
106
            raise AssertionError("Unknown blob kind, perms=%r." % (mode,))
 
107
 
 
108
 
 
109
def import_git_objects(repo, mapping, object_iter):
249
110
    """Import a set of git objects into a bzr repository.
250
111
 
251
112
    :param repo: Bazaar repository
253
114
    :param object_iter: Iterator over Git objects.
254
115
    """
255
116
    # TODO: a more (memory-)efficient implementation of this
256
 
    graph = []
 
117
    objects = {}
 
118
    for o in object_iter:
 
119
        objects[o.id] = o
257
120
    root_trees = {}
258
 
    revisions = {}
259
 
    checked = set()
260
 
    heads = list(heads)
261
 
    parent_invs_cache = LRUCache(50)
262
121
    # Find and convert commit objects
263
 
    while heads:
264
 
        if pb is not None:
265
 
            pb.update("finding revisions to fetch", len(graph), None)
266
 
        head = heads.pop()
267
 
        assert isinstance(head, str)
268
 
        try:
269
 
            o = object_iter[head]
270
 
        except KeyError:
271
 
            continue
 
122
    for o in objects.iterkeys():
272
123
        if isinstance(o, Commit):
273
124
            rev = mapping.import_commit(o)
274
 
            if repo.has_revision(rev.revision_id):
275
 
                continue
276
 
            root_trees[rev.revision_id] = o.tree
277
 
            revisions[rev.revision_id] = rev
278
 
            graph.append((rev.revision_id, rev.parent_ids))
279
 
            target_git_object_retriever._idmap.add_entry(o.sha().hexdigest(),
280
 
                "commit", (rev.revision_id, o._tree))
281
 
            heads.extend([p for p in o.parents if p not in checked])
282
 
        elif isinstance(o, Tag):
283
 
            heads.append(o.object[1])
284
 
        else:
285
 
            trace.warning("Unable to import head object %r" % o)
286
 
        checked.add(head)
287
 
    # Order the revisions
 
125
            root_trees[rev] = objects[o.tree_sha]
288
126
    # Create the inventory objects
289
 
    for i, revid in enumerate(topo_sort(graph)):
290
 
        if pb is not None:
291
 
            pb.update("fetching revisions", i, len(graph))
292
 
        rev = revisions[revid]
 
127
    for rev, root_tree in root_trees.iteritems():
293
128
        # We have to do this here, since we have to walk the tree and 
294
 
        # we need to make sure to import the blobs / trees with the right 
 
129
        # we need to make sure to import the blobs / trees with the riht 
295
130
        # path; this may involve adding them more than once.
 
131
        inv = Inventory()
296
132
        def lookup_object(sha):
297
 
            try:
298
 
                return object_iter[sha]
299
 
            except KeyError:
300
 
                return target_git_object_retriever[sha]
301
 
        parent_invs = []
302
 
        for parent_id in rev.parent_ids:
303
 
            try:
304
 
                parent_invs.append(parent_invs_cache[parent_id])
305
 
            except KeyError:
306
 
                parent_inv = repo.get_inventory(parent_id)
307
 
                parent_invs.append(parent_inv)
308
 
                parent_invs_cache[parent_id] = parent_inv
309
 
        if parent_invs == []:
310
 
            base_inv = Inventory(root_id=None)
311
 
        else:
312
 
            base_inv = parent_invs[0]
313
 
        inv_delta = import_git_tree(repo.texts, mapping, "", 
314
 
            root_trees[revid], base_inv, None, revid, parent_invs, 
315
 
            target_git_object_retriever._idmap, lookup_object)
316
 
        try:
317
 
            basis_id = rev.parent_ids[0]
318
 
        except IndexError:
319
 
            basis_id = NULL_REVISION
320
 
        rev.inventory_sha1, inv = repo.add_inventory_by_delta(basis_id,
321
 
                  inv_delta, rev.revision_id, rev.parent_ids)
322
 
        parent_invs_cache[rev.revision_id] = inv
323
 
        repo.add_revision(rev.revision_id, rev)
324
 
    target_git_object_retriever._idmap.commit()
325
 
 
326
 
 
327
 
class InterGitNonGitRepository(InterRepository):
328
 
    """Base InterRepository that copies revisions from a Git into a non-Git 
329
 
    repository."""
330
 
 
331
 
    _matching_repo_format = GitRepositoryFormat()
 
133
            if sha in objects:
 
134
                return objects[sha]
 
135
            return reconstruct_git_object(repo, mapping, sha)
 
136
        import_git_tree(repo, mapping, "", tree, inv, lookup_object)
 
137
        repo.add_revision(rev.revision_id, rev, inv)
 
138
 
 
139
 
 
140
def reconstruct_git_commit(repo, rev):
 
141
    raise NotImplementedError(self.reconstruct_git_commit)
 
142
 
 
143
 
 
144
def reconstruct_git_object(repo, mapping, sha):
 
145
    # Commit
 
146
    revid = mapping.revision_id_foreign_to_bzr(sha)
 
147
    try:
 
148
        rev = repo.get_revision(revid)
 
149
    except NoSuchRevision:
 
150
        pass
 
151
    else:
 
152
        return reconstruct_git_commit(rev)
 
153
 
 
154
    # TODO: Tree
 
155
    # TODO: Blob
 
156
    raise KeyError("No such object %s" % sha)
 
157
 
 
158
 
 
159
class InterGitRepository(InterRepository):
 
160
 
 
161
    _matching_repo_format = GitFormat()
332
162
 
333
163
    @staticmethod
334
164
    def _get_repo_format_to_test():
338
168
        """See InterRepository.copy_content."""
339
169
        self.fetch(revision_id, pb, find_ghosts=False)
340
170
 
341
 
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, mapping=None,
342
 
            fetch_spec=None):
343
 
        self.fetch_refs(revision_id=revision_id, pb=pb, find_ghosts=find_ghosts,
344
 
                mapping=mapping, fetch_spec=fetch_spec)
345
 
 
346
 
    def fetch_refs(self, revision_id=None, pb=None, find_ghosts=False, 
347
 
              mapping=None, fetch_spec=None):
 
171
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, 
 
172
              mapping=None):
348
173
        if mapping is None:
349
174
            mapping = self.source.get_mapping()
350
 
        if revision_id is not None:
351
 
            interesting_heads = [revision_id]
352
 
        elif fetch_spec is not None:
353
 
            interesting_heads = fetch_spec.heads
354
 
        else:
355
 
            interesting_heads = None
356
 
        self._refs = {}
357
 
        def determine_wants(refs):
358
 
            self._refs = refs
359
 
            if interesting_heads is None:
360
 
                ret = [sha for (ref, sha) in refs.iteritems() if not ref.endswith("^{}")]
361
 
            else:
362
 
                ret = [mapping.revision_id_bzr_to_foreign(revid)[0] for revid in interesting_heads]
 
175
        def progress(text):
 
176
            if pb is not None:
 
177
                pb.note("git: %s" % text)
 
178
            else:
 
179
                info("git: %s" % text)
 
180
        def determine_wants(heads):
 
181
            if revision_id is None:
 
182
                ret = heads.values()
 
183
            else:
 
184
                ret = [mapping.revision_id_bzr_to_foreign(revision_id)]
363
185
            return [rev for rev in ret if not self.target.has_revision(mapping.revision_id_foreign_to_bzr(rev))]
364
 
        self.fetch_objects(determine_wants, mapping, pb)
365
 
        return self._refs
366
 
 
367
 
 
368
 
 
369
 
class InterRemoteGitNonGitRepository(InterGitNonGitRepository):
370
 
    """InterRepository that copies revisions from a remote Git into a non-Git 
371
 
    repository."""
372
 
 
373
 
    def fetch_objects(self, determine_wants, mapping, pb=None):
374
 
        def progress(text):
375
 
            pb.update("git: %s" % text.rstrip("\r\n"), 0, 0)
376
186
        graph_walker = BzrFetchGraphWalker(self.target, mapping)
377
 
        create_pb = None
378
 
        if pb is None:
379
 
            create_pb = pb = ui.ui_factory.nested_progress_bar()
380
 
        target_git_object_retriever = BazaarObjectStore(self.target, mapping)
381
 
        recorded_wants = []
382
 
 
383
 
        def record_determine_wants(heads):
384
 
            wants = determine_wants(heads)
385
 
            recorded_wants.extend(wants)
386
 
            return wants
387
 
        
388
 
        try:
389
 
            self.target.lock_write()
390
 
            try:
391
 
                self.target.start_write_group()
392
 
                try:
393
 
                    objects_iter = self.source.fetch_objects(
394
 
                                record_determine_wants, 
395
 
                                graph_walker, 
396
 
                                target_git_object_retriever.get_raw, 
397
 
                                progress)
398
 
                    import_git_objects(self.target, mapping, objects_iter, 
399
 
                            target_git_object_retriever, recorded_wants, pb)
400
 
                finally:
401
 
                    self.target.commit_write_group()
402
 
            finally:
403
 
                self.target.unlock()
404
 
        finally:
405
 
            if create_pb:
406
 
                create_pb.finished()
407
 
 
408
 
    @staticmethod
409
 
    def is_compatible(source, target):
410
 
        """Be compatible with GitRepository."""
411
 
        # FIXME: Also check target uses VersionedFile
412
 
        return (isinstance(source, RemoteGitRepository) and 
413
 
                target.supports_rich_root() and
414
 
                not isinstance(target, GitRepository))
415
 
 
416
 
 
417
 
class InterLocalGitNonGitRepository(InterGitNonGitRepository):
418
 
    """InterRepository that copies revisions from a remote Git into a non-Git 
419
 
    repository."""
420
 
 
421
 
    def fetch_objects(self, determine_wants, mapping, pb=None):
422
 
        wants = determine_wants(self.source._git.get_refs())
423
 
        create_pb = None
424
 
        if pb is None:
425
 
            create_pb = pb = ui.ui_factory.nested_progress_bar()
426
 
        target_git_object_retriever = BazaarObjectStore(self.target, mapping)
427
 
        try:
428
 
            self.target.lock_write()
429
 
            try:
430
 
                self.target.start_write_group()
431
 
                try:
432
 
                    import_git_objects(self.target, mapping, 
433
 
                            self.source._git.object_store, 
434
 
                            target_git_object_retriever, wants, pb)
435
 
                finally:
436
 
                    self.target.commit_write_group()
437
 
            finally:
438
 
                self.target.unlock()
439
 
        finally:
440
 
            if create_pb:
441
 
                create_pb.finished()
 
187
        self.target.lock_write()
 
188
        try:
 
189
            import_git_objects(self.target, mapping,
 
190
                self.source.fetch_objects(determine_wants, graph_walker, 
 
191
                    progress))
 
192
        finally:
 
193
            self.target.unlock()
442
194
 
443
195
    @staticmethod
444
196
    def is_compatible(source, target):
445
197
        """Be compatible with GitRepository."""
446
198
        # FIXME: Also check target uses VersionedFile
447
199
        return (isinstance(source, LocalGitRepository) and 
448
 
                target.supports_rich_root() and
449
 
                not isinstance(target, GitRepository))
450
 
 
451
 
 
452
 
class InterGitRepository(InterRepository):
453
 
    """InterRepository that copies between Git repositories."""
454
 
 
455
 
    _matching_repo_format = GitRepositoryFormat()
456
 
 
457
 
    @staticmethod
458
 
    def _get_repo_format_to_test():
459
 
        return None
460
 
 
461
 
    def copy_content(self, revision_id=None, pb=None):
462
 
        """See InterRepository.copy_content."""
463
 
        self.fetch(revision_id, pb, find_ghosts=False)
464
 
 
465
 
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, 
466
 
              mapping=None, fetch_spec=None):
467
 
        if mapping is None:
468
 
            mapping = self.source.get_mapping()
469
 
        def progress(text):
470
 
            trace.info("git: %s", text)
471
 
        r = self.target._git
472
 
        if revision_id is not None:
473
 
            args = [mapping.revision_id_bzr_to_foreign(revision_id)[0]]
474
 
        elif fetch_spec is not None:
475
 
            args = [mapping.revision_id_bzr_to_foreign(revid)[0] for revid in fetch_spec.heads]
476
 
        if fetch_spec is None and revision_id is None:
477
 
            determine_wants = r.object_store.determine_wants_all
478
 
        else:
479
 
            determine_wants = lambda x: [y for y in args if not y in r.object_store]
480
 
 
481
 
        graphwalker = SimpleFetchGraphWalker(r.heads().values(), r.get_parents)
482
 
        f, commit = r.object_store.add_pack()
483
 
        try:
484
 
            self.source._git.fetch_pack(path, determine_wants, graphwalker, f.write, progress)
485
 
            f.close()
486
 
            commit()
487
 
        except:
488
 
            f.close()
489
 
            raise
490
 
 
491
 
    @staticmethod
492
 
    def is_compatible(source, target):
493
 
        """Be compatible with GitRepository."""
494
 
        return (isinstance(source, GitRepository) and 
495
 
                isinstance(target, GitRepository))
 
200
                target.supports_rich_root())