1
 
# Copyright (C) 2008 Canonical Ltd
 
3
 
# This program is free software; you can redistribute it and/or modify
 
4
 
# it under the terms of the GNU General Public License as published by
 
5
 
# the Free Software Foundation; either version 2 of the License, or
 
6
 
# (at your option) any later version.
 
8
 
# This program is distributed in the hope that it will be useful,
 
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
 
# GNU General Public License for more details.
 
13
 
# You should have received a copy of the GNU General Public License
 
14
 
# along with this program; if not, write to the Free Software
 
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
17
 
from bzrlib import osutils, ui, urlutils
 
18
 
from bzrlib.errors import InvalidRevisionId, NoSuchRevision
 
19
 
from bzrlib.inventory import Inventory
 
20
 
from bzrlib.repository import InterRepository
 
21
 
from bzrlib.trace import info
 
22
 
from bzrlib.tsort import topo_sort
 
24
 
from bzrlib.plugins.git.repository import (
 
29
 
from bzrlib.plugins.git.converter import GitObjectConverter
 
30
 
from bzrlib.plugins.git.remote import RemoteGitRepository
 
33
 
from dulwich.client import SimpleFetchGraphWalker
 
34
 
from dulwich.objects import Commit
 
36
 
from cStringIO import StringIO
 
39
 
class BzrFetchGraphWalker(object):
 
40
 
    """GraphWalker implementation that uses a Bazaar repository."""
 
42
 
    def __init__(self, repository, mapping):
 
43
 
        self.repository = repository
 
44
 
        self.mapping = mapping
 
46
 
        self.heads = set(repository.all_revision_ids())
 
50
 
        return iter(self.next, None)
 
53
 
        revid = self.mapping.revision_id_foreign_to_bzr(sha)
 
56
 
    def remove(self, revid):
 
58
 
        if revid in self.heads:
 
59
 
            self.heads.remove(revid)
 
60
 
        if revid in self.parents:
 
61
 
            for p in self.parents[revid]:
 
66
 
            ret = self.heads.pop()
 
67
 
            ps = self.repository.get_parent_map([ret])[ret]
 
68
 
            self.parents[ret] = ps
 
69
 
            self.heads.update([p for p in ps if not p in self.done])
 
72
 
                return self.mapping.revision_id_bzr_to_foreign(ret)[0]
 
73
 
            except InvalidRevisionId:
 
78
 
def import_git_blob(repo, mapping, path, blob, inv, parent_invs, gitmap, executable):
 
79
 
    """Import a git blob object into a bzr repository.
 
81
 
    :param repo: bzr repository
 
82
 
    :param path: Path in the tree
 
83
 
    :param blob: A git blob
 
85
 
    file_id = mapping.generate_file_id(path)
 
86
 
    text_revision = inv.revision_id
 
87
 
    repo.texts.add_lines((file_id, text_revision),
 
88
 
        [(file_id, p[file_id].revision) for p in parent_invs if file_id in p],
 
89
 
        osutils.split_lines(blob.data))
 
90
 
    ie = inv.add_path(path, "file", file_id)
 
91
 
    ie.revision = text_revision
 
92
 
    ie.text_size = len(blob.data)
 
93
 
    ie.text_sha1 = osutils.sha_string(blob.data)
 
94
 
    ie.executable = executable
 
95
 
    gitmap._idmap.add_entry(blob.sha().hexdigest(), "blob", (ie.file_id, ie.revision))
 
98
 
def import_git_tree(repo, mapping, path, tree, inv, parent_invs, 
 
99
 
                    gitmap, lookup_object):
 
100
 
    """Import a git tree object into a bzr repository.
 
102
 
    :param repo: A Bzr repository object
 
103
 
    :param path: Path in the tree
 
104
 
    :param tree: A git tree object
 
105
 
    :param inv: Inventory object
 
107
 
    file_id = mapping.generate_file_id(path)
 
108
 
    text_revision = inv.revision_id
 
109
 
    repo.texts.add_lines((file_id, text_revision),
 
110
 
        [(file_id, p[file_id].revision) for p in parent_invs if file_id in p],
 
112
 
    ie = inv.add_path(path, "directory", file_id)
 
113
 
    ie.revision = text_revision
 
114
 
    gitmap._idmap.add_entry(tree.sha().hexdigest(), "tree", (file_id, text_revision))
 
115
 
    for mode, name, hexsha in tree.entries():
 
116
 
        entry_kind = (mode & 0700000) / 0100000
 
117
 
        basename = name.decode("utf-8")
 
121
 
            child_path = urlutils.join(path, name)
 
123
 
            tree = lookup_object(hexsha)
 
124
 
            import_git_tree(repo, mapping, child_path, tree, inv, parent_invs, gitmap, lookup_object)
 
125
 
        elif entry_kind == 1:
 
126
 
            blob = lookup_object(hexsha)
 
127
 
            fs_mode = mode & 0777
 
128
 
            import_git_blob(repo, mapping, child_path, blob, inv, parent_invs, gitmap, bool(fs_mode & 0111))
 
130
 
            raise AssertionError("Unknown blob kind, perms=%r." % (mode,))
 
133
 
def import_git_objects(repo, mapping, object_iter, target_git_object_retriever, 
 
135
 
    """Import a set of git objects into a bzr repository.
 
137
 
    :param repo: Bazaar repository
 
138
 
    :param mapping: Mapping to use
 
139
 
    :param object_iter: Iterator over Git objects.
 
141
 
    # TODO: a more (memory-)efficient implementation of this
 
145
 
    # Find and convert commit objects
 
146
 
    for o in object_iter.iterobjects():
 
147
 
        if isinstance(o, Commit):
 
148
 
            rev = mapping.import_commit(o)
 
149
 
            root_trees[rev.revision_id] = object_iter[o.tree]
 
150
 
            revisions[rev.revision_id] = rev
 
151
 
            graph.append((rev.revision_id, rev.parent_ids))
 
152
 
            target_git_object_retriever._idmap.add_entry(o.sha().hexdigest(), "commit", (rev.revision_id, o._tree))
 
153
 
    # Order the revisions
 
154
 
    # Create the inventory objects
 
155
 
    for i, revid in enumerate(topo_sort(graph)):
 
157
 
            pb.update("fetching revisions", i, len(graph))
 
158
 
        root_tree = root_trees[revid]
 
159
 
        rev = revisions[revid]
 
160
 
        # We have to do this here, since we have to walk the tree and 
 
161
 
        # we need to make sure to import the blobs / trees with the riht 
 
162
 
        # path; this may involve adding them more than once.
 
164
 
        inv.revision_id = rev.revision_id
 
165
 
        def lookup_object(sha):
 
166
 
            if sha in object_iter:
 
167
 
                return object_iter[sha]
 
168
 
            return target_git_object_retriever[sha]
 
169
 
        parent_invs = [repo.get_inventory(r) for r in rev.parent_ids]
 
170
 
        import_git_tree(repo, mapping, "", root_tree, inv, parent_invs, 
 
171
 
            target_git_object_retriever, lookup_object)
 
172
 
        repo.add_revision(rev.revision_id, rev, inv)
 
175
 
class InterGitNonGitRepository(InterRepository):
 
177
 
    _matching_repo_format = GitFormat()
 
180
 
    def _get_repo_format_to_test():
 
183
 
    def copy_content(self, revision_id=None, pb=None):
 
184
 
        """See InterRepository.copy_content."""
 
185
 
        self.fetch(revision_id, pb, find_ghosts=False)
 
187
 
    def fetch_objects(self, determine_wants, mapping, pb=None):
 
189
 
            pb.update("git: %s" % text.rstrip("\r\n"), 0, 0)
 
190
 
        graph_walker = BzrFetchGraphWalker(self.target, mapping)
 
193
 
            create_pb = pb = ui.ui_factory.nested_progress_bar()
 
194
 
        target_git_object_retriever = GitObjectConverter(self.target, mapping)
 
197
 
            self.target.lock_write()
 
199
 
                self.target.start_write_group()
 
201
 
                    objects_iter = self.source.fetch_objects(determine_wants, 
 
203
 
                                target_git_object_retriever.__getitem__, 
 
205
 
                    import_git_objects(self.target, mapping, objects_iter, 
 
206
 
                            target_git_object_retriever, pb)
 
208
 
                    self.target.commit_write_group()
 
215
 
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, 
 
218
 
            mapping = self.source.get_mapping()
 
219
 
        def determine_wants(heads):
 
220
 
            if revision_id is None:
 
223
 
                ret = [mapping.revision_id_bzr_to_foreign(revision_id)[0]]
 
224
 
            return [rev for rev in ret if not self.target.has_revision(mapping.revision_id_foreign_to_bzr(rev))]
 
225
 
        return self.fetch_objects(determine_wants, mapping, pb)
 
228
 
    def is_compatible(source, target):
 
229
 
        """Be compatible with GitRepository."""
 
230
 
        # FIXME: Also check target uses VersionedFile
 
231
 
        return (isinstance(source, GitRepository) and 
 
232
 
                target.supports_rich_root() and
 
233
 
                not isinstance(target, GitRepository))
 
236
 
class InterGitRepository(InterRepository):
 
238
 
    _matching_repo_format = GitFormat()
 
241
 
    def _get_repo_format_to_test():
 
244
 
    def copy_content(self, revision_id=None, pb=None):
 
245
 
        """See InterRepository.copy_content."""
 
246
 
        self.fetch(revision_id, pb, find_ghosts=False)
 
248
 
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, 
 
251
 
            mapping = self.source.get_mapping()
 
253
 
            info("git: %s", text)
 
255
 
        if revision_id is None:
 
256
 
            determine_wants = lambda x: [y for y in x.values() if not y in r.object_store]
 
258
 
            args = [mapping.revision_id_bzr_to_foreign(revision_id)[0]]
 
259
 
            determine_wants = lambda x: [y for y in args if not y in r.object_store]
 
261
 
        graphwalker = SimpleFetchGraphWalker(r.heads().values(), r.get_parents)
 
262
 
        f, commit = r.object_store.add_pack()
 
264
 
            self.source._git.fetch_pack(path, determine_wants, graphwalker, f.write, progress)
 
272
 
    def is_compatible(source, target):
 
273
 
        """Be compatible with GitRepository."""
 
274
 
        return (isinstance(source, GitRepository) and 
 
275
 
                isinstance(target, GitRepository))