/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to fetch.py

Fix some bit of fetching.

Show diffs side-by-side

added added

removed removed

Lines of Context:
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
from bzrlib import osutils, ui, urlutils
 
17
from bzrlib import osutils, urlutils
18
18
from bzrlib.errors import InvalidRevisionId
19
19
from bzrlib.inventory import Inventory
20
20
from bzrlib.repository import InterRepository
21
21
from bzrlib.trace import info
22
 
from bzrlib.tsort import topo_sort
23
22
 
24
 
from bzrlib.plugins.git.repository import (
25
 
        LocalGitRepository, 
26
 
        GitRepository, 
27
 
        GitFormat,
28
 
        )
 
23
from bzrlib.plugins.git import git
 
24
from bzrlib.plugins.git.repository import LocalGitRepository, GitRepository, GitFormat
29
25
from bzrlib.plugins.git.remote import RemoteGitRepository
30
26
 
31
 
import dulwich as git
32
 
from dulwich.client import SimpleFetchGraphWalker
33
27
from dulwich.objects import Commit
34
28
 
35
29
from cStringIO import StringIO
36
30
 
37
31
 
38
32
class BzrFetchGraphWalker(object):
39
 
    """GraphWalker implementation that uses a Bazaar repository."""
40
33
 
41
34
    def __init__(self, repository, mapping):
42
35
        self.repository = repository
45
38
        self.heads = set(repository.all_revision_ids())
46
39
        self.parents = {}
47
40
 
48
 
    def __iter__(self):
49
 
        return iter(self.next, None)
50
 
 
51
41
    def ack(self, sha):
52
42
        revid = self.mapping.revision_id_foreign_to_bzr(sha)
53
43
        self.remove(revid)
54
44
 
55
45
    def remove(self, revid):
56
46
        self.done.add(revid)
57
 
        if revid in self.heads:
 
47
        if ref in self.heads:
58
48
            self.heads.remove(revid)
59
49
        if revid in self.parents:
60
50
            for p in self.parents[revid]:
68
58
            self.heads.update([p for p in ps if not p in self.done])
69
59
            try:
70
60
                self.done.add(ret)
71
 
                return self.mapping.revision_id_bzr_to_foreign(ret)[0]
 
61
                return self.mapping.revision_id_bzr_to_foreign(ret)
72
62
            except InvalidRevisionId:
73
63
                pass
74
64
        return None
75
65
 
76
66
 
77
 
def import_git_blob(repo, mapping, path, blob, inv, parent_invs, executable):
 
67
def import_git_blob(repo, mapping, path, blob, inv):
78
68
    """Import a git blob object into a bzr repository.
79
69
 
80
70
    :param repo: bzr repository
82
72
    :param blob: A git blob
83
73
    """
84
74
    file_id = mapping.generate_file_id(path)
85
 
    text_revision = inv.revision_id
86
 
    repo.texts.add_lines((file_id, text_revision),
87
 
        [(file_id, p[file_id].revision) for p in parent_invs if file_id in p],
 
75
    repo.texts.add_lines((file_id, blob.id),
 
76
        [], #FIXME 
88
77
        osutils.split_lines(blob.data))
89
78
    ie = inv.add_path(path, "file", file_id)
90
 
    ie.revision = text_revision
91
 
    ie.text_size = len(blob.data)
92
 
    ie.text_sha1 = osutils.sha_string(blob.data)
93
 
    ie.executable = executable
94
 
 
95
 
 
96
 
def import_git_tree(repo, mapping, path, tree, inv, parent_invs, lookup_object):
 
79
 
 
80
 
 
81
def import_git_tree(repo, mapping, path, tree, inv, lookup_object):
97
82
    """Import a git tree object into a bzr repository.
98
83
 
99
84
    :param repo: A Bzr repository object
102
87
    :param inv: Inventory object
103
88
    """
104
89
    file_id = mapping.generate_file_id(path)
105
 
    text_revision = inv.revision_id
106
 
    repo.texts.add_lines((file_id, text_revision),
107
 
        [(file_id, p[file_id].revision) for p in parent_invs if file_id in p],
 
90
    repo.texts.add_lines((file_id, tree.id),
 
91
        [], #FIXME 
108
92
        [])
109
 
    ie = inv.add_path(path, "directory", file_id)
110
 
    ie.revision = text_revision
 
93
    inv.add_path(path, "directory", file_id)
111
94
    for mode, name, hexsha in tree.entries():
112
95
        entry_kind = (mode & 0700000) / 0100000
113
96
        basename = name.decode("utf-8")
117
100
            child_path = urlutils.join(path, name)
118
101
        if entry_kind == 0:
119
102
            tree = lookup_object(hexsha)
120
 
            import_git_tree(repo, mapping, child_path, tree, inv, parent_invs, lookup_object)
 
103
            import_git_tree(repo, mapping, child_path, tree, inv, lookup_object)
121
104
        elif entry_kind == 1:
122
105
            blob = lookup_object(hexsha)
123
 
            fs_mode = mode & 0777
124
 
            import_git_blob(repo, mapping, child_path, blob, inv, parent_invs, bool(fs_mode & 0111))
 
106
            import_git_blob(repo, mapping, child_path, blob, inv)
125
107
        else:
126
108
            raise AssertionError("Unknown blob kind, perms=%r." % (mode,))
127
109
 
128
110
 
129
 
def import_git_objects(repo, mapping, num_objects, object_iter, pb=None):
 
111
def import_git_objects(repo, mapping, object_iter):
130
112
    """Import a set of git objects into a bzr repository.
131
113
 
132
114
    :param repo: Bazaar repository
133
115
    :param mapping: Mapping to use
134
 
    :param num_objects: Number of objects.
135
116
    :param object_iter: Iterator over Git objects.
136
117
    """
137
118
    # TODO: a more (memory-)efficient implementation of this
138
119
    objects = {}
139
 
    for i, (o, _) in enumerate(object_iter):
140
 
        if pb is not None:
141
 
            pb.update("fetching objects", i, num_objects) 
 
120
    for o in object_iter:
142
121
        objects[o.id] = o
143
 
    graph = []
144
122
    root_trees = {}
145
 
    revisions = {}
146
123
    # Find and convert commit objects
147
124
    for o in objects.itervalues():
148
125
        if isinstance(o, Commit):
149
126
            rev = mapping.import_commit(o)
150
 
            root_trees[rev.revision_id] = objects[o.tree]
151
 
            revisions[rev.revision_id] = rev
152
 
            graph.append((rev.revision_id, rev.parent_ids))
153
 
    # Order the revisions
 
127
            root_trees[rev] = objects[o.tree]
154
128
    # Create the inventory objects
155
 
    for i, revid in enumerate(topo_sort(graph)):
156
 
        if pb is not None:
157
 
            pb.update("fetching revisions", i, len(graph))
158
 
        root_tree = root_trees[revid]
159
 
        rev = revisions[revid]
 
129
    for rev, root_tree in root_trees.iteritems():
160
130
        # We have to do this here, since we have to walk the tree and 
161
131
        # we need to make sure to import the blobs / trees with the riht 
162
132
        # path; this may involve adding them more than once.
166
136
            if sha in objects:
167
137
                return objects[sha]
168
138
            return reconstruct_git_object(repo, mapping, sha)
169
 
        parent_invs = [repo.get_inventory(r) for r in rev.parent_ids]
170
 
        import_git_tree(repo, mapping, "", root_tree, inv, parent_invs, 
171
 
            lookup_object)
 
139
        import_git_tree(repo, mapping, "", root_tree, inv, lookup_object)
172
140
        repo.add_revision(rev.revision_id, rev, inv)
173
141
 
174
142
 
191
159
    raise KeyError("No such object %s" % sha)
192
160
 
193
161
 
194
 
class InterGitNonGitRepository(InterRepository):
 
162
class InterGitRepository(InterRepository):
195
163
 
196
164
    _matching_repo_format = GitFormat()
197
165
 
208
176
        if mapping is None:
209
177
            mapping = self.source.get_mapping()
210
178
        def progress(text):
211
 
            pb.update("git: %s" % text.rstrip("\r\n"), 0, 0)
 
179
            if pb is not None:
 
180
                pb.note("git: %s" % text)
 
181
            else:
 
182
                info("git: %s" % text)
212
183
        def determine_wants(heads):
213
184
            if revision_id is None:
214
185
                ret = heads.values()
215
186
            else:
216
 
                ret = [mapping.revision_id_bzr_to_foreign(revision_id)[0]]
 
187
                ret = [mapping.revision_id_bzr_to_foreign(revision_id)]
217
188
            return [rev for rev in ret if not self.target.has_revision(mapping.revision_id_foreign_to_bzr(rev))]
218
189
        graph_walker = BzrFetchGraphWalker(self.target, mapping)
219
 
        create_pb = None
220
 
        if pb is None:
221
 
            create_pb = pb = ui.ui_factory.nested_progress_bar()
 
190
        self.target.lock_write()
222
191
        try:
223
 
            self.target.lock_write()
 
192
            self.target.start_write_group()
224
193
            try:
225
 
                self.target.start_write_group()
226
 
                try:
227
 
                    (num_objects, objects_iter) = \
228
 
                            self.source.fetch_objects(determine_wants, 
229
 
                                graph_walker, progress)
230
 
                    import_git_objects(self.target, mapping, num_objects, 
231
 
                                       objects_iter, pb)
232
 
                finally:
233
 
                    self.target.commit_write_group()
 
194
                import_git_objects(self.target, mapping,
 
195
                    iter(self.source.fetch_objects(determine_wants, graph_walker, 
 
196
                        progress)))
234
197
            finally:
235
 
                self.target.unlock()
 
198
                self.target.commit_write_group()
236
199
        finally:
237
 
            if create_pb:
238
 
                create_pb.finished()
 
200
            self.target.unlock()
239
201
 
240
202
    @staticmethod
241
203
    def is_compatible(source, target):
242
204
        """Be compatible with GitRepository."""
243
205
        # FIXME: Also check target uses VersionedFile
244
 
        return (isinstance(source, GitRepository) and 
245
 
                target.supports_rich_root() and
246
 
                not isinstance(target, GitRepository))
247
 
 
248
 
 
249
 
class InterGitRepository(InterRepository):
250
 
 
251
 
    _matching_repo_format = GitFormat()
252
 
 
253
 
    @staticmethod
254
 
    def _get_repo_format_to_test():
255
 
        return None
256
 
 
257
 
    def copy_content(self, revision_id=None, pb=None):
258
 
        """See InterRepository.copy_content."""
259
 
        self.fetch(revision_id, pb, find_ghosts=False)
260
 
 
261
 
    def fetch(self, revision_id=None, pb=None, find_ghosts=False, 
262
 
              mapping=None):
263
 
        if mapping is None:
264
 
            mapping = self.source.get_mapping()
265
 
        def progress(text):
266
 
            info("git: %s", text)
267
 
        r = self.target._git
268
 
        if revision_id is None:
269
 
            determine_wants = lambda x: [y for y in x.values() if not y in r.object_store]
270
 
        else:
271
 
            args = [mapping.revision_id_bzr_to_foreign(revision_id)[0]]
272
 
            determine_wants = lambda x: [y for y in args if not y in r.object_store]
273
 
 
274
 
        graphwalker = SimpleFetchGraphWalker(r.heads().values(), r.get_parents)
275
 
        f, commit = r.object_store.add_pack()
276
 
        try:
277
 
            self.source._git.fetch_pack(path, determine_wants, graphwalker, f.write, progress)
278
 
            f.close()
279
 
            commit()
280
 
        except:
281
 
            f.close()
282
 
            raise
283
 
 
284
 
    @staticmethod
285
 
    def is_compatible(source, target):
286
 
        """Be compatible with GitRepository."""
287
 
        return (isinstance(source, GitRepository) and 
288
 
                isinstance(target, GitRepository))
 
206
        return (isinstance(source, LocalGitRepository) and 
 
207
                target.supports_rich_root())