/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to transportgit.py

Multiple merges:
 * push should work with branches without a working tree.
 * Knit pushes on SFTP are now much faster (removed a bad latency multiplier).
 * Reconciles at the end of fetch now skip non-dataloss issues. The command line
   reconcile will still check all data.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2010 Jelmer Vernooij <jelmer@samba.org>
2
 
#
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
#
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
#
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
"""A Git repository implementation that uses a Bazaar transport."""
18
 
 
19
 
from cStringIO import StringIO
20
 
 
21
 
from dulwich.errors import (
22
 
    NotGitRepository,
23
 
    NoIndexPresent,
24
 
    )
25
 
from dulwich.objects import (
26
 
    ShaFile,
27
 
    )
28
 
from dulwich.object_store import (
29
 
    PackBasedObjectStore,
30
 
    PACKDIR,
31
 
    )
32
 
from dulwich.pack import (
33
 
    MemoryPackIndex,
34
 
    PackData,
35
 
    Pack,
36
 
    ThinPackData,
37
 
    iter_sha1,
38
 
    load_pack_index_file,
39
 
    write_pack_data,
40
 
    write_pack_index_v2,
41
 
    )
42
 
from dulwich.repo import (
43
 
    BaseRepo,
44
 
    RefsContainer,
45
 
    INDEX_FILENAME,
46
 
    OBJECTDIR,
47
 
    REFSDIR,
48
 
    SYMREF,
49
 
    check_ref_format,
50
 
    read_packed_refs_with_peeled,
51
 
    read_packed_refs,
52
 
    write_packed_refs,
53
 
    )
54
 
 
55
 
from bzrlib.errors import (
56
 
    FileExists,
57
 
    NoSuchFile,
58
 
    TransportNotPossible,
59
 
    )
60
 
 
61
 
 
62
 
class TransportRefsContainer(RefsContainer):
63
 
    """Refs container that reads refs from a transport."""
64
 
 
65
 
    def __init__(self, transport):
66
 
        self.transport = transport
67
 
        self._packed_refs = None
68
 
        self._peeled_refs = None
69
 
 
70
 
    def __repr__(self):
71
 
        return "%s(%r)" % (self.__class__.__name__, self.transport)
72
 
 
73
 
    def _ensure_dir_exists(self, path):
74
 
        for n in range(path.count("/")):
75
 
            dirname = "/".join(path.split("/")[:n+1])
76
 
            try:
77
 
                self.transport.mkdir(dirname)
78
 
            except FileExists:
79
 
                pass
80
 
 
81
 
    def subkeys(self, base):
82
 
        keys = set()
83
 
        try:
84
 
            iter_files = self.transport.clone(base).iter_files_recursive()
85
 
            keys.update(("%s/%s" % (base, refname)).strip("/") for 
86
 
                    refname in iter_files if check_ref_format("%s/%s" % (base, refname)))
87
 
        except (TransportNotPossible, NoSuchFile):
88
 
            pass
89
 
        for key in self.get_packed_refs():
90
 
            if key.startswith(base):
91
 
                keys.add(key[len(base):].strip("/"))
92
 
        return keys
93
 
 
94
 
    def allkeys(self):
95
 
        keys = set()
96
 
        if self.transport.has("HEAD"):
97
 
            keys.add("HEAD")
98
 
        try:
99
 
            iter_files = list(self.transport.clone("refs").iter_files_recursive())
100
 
            for filename in iter_files:
101
 
                refname = "refs/%s" % filename
102
 
                if check_ref_format(refname):
103
 
                    keys.add(refname)
104
 
        except (TransportNotPossible, NoSuchFile):
105
 
            pass
106
 
        keys.update(self.get_packed_refs())
107
 
        return keys
108
 
 
109
 
    def get_packed_refs(self):
110
 
        """Get contents of the packed-refs file.
111
 
 
112
 
        :return: Dictionary mapping ref names to SHA1s
113
 
 
114
 
        :note: Will return an empty dictionary when no packed-refs file is
115
 
            present.
116
 
        """
117
 
        # TODO: invalidate the cache on repacking
118
 
        if self._packed_refs is None:
119
 
            # set both to empty because we want _peeled_refs to be
120
 
            # None if and only if _packed_refs is also None.
121
 
            self._packed_refs = {}
122
 
            self._peeled_refs = {}
123
 
            try:
124
 
                f = self.transport.get("packed-refs")
125
 
            except NoSuchFile:
126
 
                return {}
127
 
            try:
128
 
                first_line = iter(f).next().rstrip()
129
 
                if (first_line.startswith("# pack-refs") and " peeled" in
130
 
                        first_line):
131
 
                    for sha, name, peeled in read_packed_refs_with_peeled(f):
132
 
                        self._packed_refs[name] = sha
133
 
                        if peeled:
134
 
                            self._peeled_refs[name] = peeled
135
 
                else:
136
 
                    f.seek(0)
137
 
                    for sha, name in read_packed_refs(f):
138
 
                        self._packed_refs[name] = sha
139
 
            finally:
140
 
                f.close()
141
 
        return self._packed_refs
142
 
 
143
 
    def get_peeled(self, name):
144
 
        """Return the cached peeled value of a ref, if available.
145
 
 
146
 
        :param name: Name of the ref to peel
147
 
        :return: The peeled value of the ref. If the ref is known not point to a
148
 
            tag, this will be the SHA the ref refers to. If the ref may point to
149
 
            a tag, but no cached information is available, None is returned.
150
 
        """
151
 
        self.get_packed_refs()
152
 
        if self._peeled_refs is None or name not in self._packed_refs:
153
 
            # No cache: no peeled refs were read, or this ref is loose
154
 
            return None
155
 
        if name in self._peeled_refs:
156
 
            return self._peeled_refs[name]
157
 
        else:
158
 
            # Known not peelable
159
 
            return self[name]
160
 
 
161
 
    def read_loose_ref(self, name):
162
 
        """Read a reference file and return its contents.
163
 
 
164
 
        If the reference file a symbolic reference, only read the first line of
165
 
        the file. Otherwise, only read the first 40 bytes.
166
 
 
167
 
        :param name: the refname to read, relative to refpath
168
 
        :return: The contents of the ref file, or None if the file does not
169
 
            exist.
170
 
        :raises IOError: if any other error occurs
171
 
        """
172
 
        try:
173
 
            f = self.transport.get(name)
174
 
        except NoSuchFile:
175
 
            return None
176
 
        try:
177
 
            header = f.read(len(SYMREF))
178
 
            if header == SYMREF:
179
 
                # Read only the first line
180
 
                return header + iter(f).next().rstrip("\r\n")
181
 
            else:
182
 
                # Read only the first 40 bytes
183
 
                return header + f.read(40-len(SYMREF))
184
 
        finally:
185
 
            f.close()
186
 
 
187
 
    def _remove_packed_ref(self, name):
188
 
        if self._packed_refs is None:
189
 
            return
190
 
        # reread cached refs from disk, while holding the lock
191
 
 
192
 
        self._packed_refs = None
193
 
        self.get_packed_refs()
194
 
 
195
 
        if name not in self._packed_refs:
196
 
            return
197
 
 
198
 
        del self._packed_refs[name]
199
 
        if name in self._peeled_refs:
200
 
            del self._peeled_refs[name]
201
 
        f = self.transport.open_write_stream("packed-refs")
202
 
        try:
203
 
            write_packed_refs(f, self._packed_refs, self._peeled_refs)
204
 
        finally:
205
 
            f.close()
206
 
 
207
 
    def set_symbolic_ref(self, name, other):
208
 
        """Make a ref point at another ref.
209
 
 
210
 
        :param name: Name of the ref to set
211
 
        :param other: Name of the ref to point at
212
 
        """
213
 
        self._check_refname(name)
214
 
        self._check_refname(other)
215
 
        self._ensure_dir_exists(name)
216
 
        self.transport.put_bytes(name, SYMREF + other + '\n')
217
 
 
218
 
    def set_if_equals(self, name, old_ref, new_ref):
219
 
        """Set a refname to new_ref only if it currently equals old_ref.
220
 
 
221
 
        This method follows all symbolic references, and can be used to perform
222
 
        an atomic compare-and-swap operation.
223
 
 
224
 
        :param name: The refname to set.
225
 
        :param old_ref: The old sha the refname must refer to, or None to set
226
 
            unconditionally.
227
 
        :param new_ref: The new sha the refname will refer to.
228
 
        :return: True if the set was successful, False otherwise.
229
 
        """
230
 
        try:
231
 
            realname, _ = self._follow(name)
232
 
        except KeyError:
233
 
            realname = name
234
 
        self._ensure_dir_exists(realname)
235
 
        self.transport.put_bytes(realname, new_ref+"\n")
236
 
        return True
237
 
 
238
 
    def add_if_new(self, name, ref):
239
 
        """Add a new reference only if it does not already exist.
240
 
 
241
 
        This method follows symrefs, and only ensures that the last ref in the
242
 
        chain does not exist.
243
 
 
244
 
        :param name: The refname to set.
245
 
        :param ref: The new sha the refname will refer to.
246
 
        :return: True if the add was successful, False otherwise.
247
 
        """
248
 
        try:
249
 
            realname, contents = self._follow(name)
250
 
            if contents is not None:
251
 
                return False
252
 
        except KeyError:
253
 
            realname = name
254
 
        self._check_refname(realname)
255
 
        self._ensure_dir_exists(realname)
256
 
        self.transport.put_bytes(realname, ref+"\n")
257
 
        return True
258
 
 
259
 
    def remove_if_equals(self, name, old_ref):
260
 
        """Remove a refname only if it currently equals old_ref.
261
 
 
262
 
        This method does not follow symbolic references. It can be used to
263
 
        perform an atomic compare-and-delete operation.
264
 
 
265
 
        :param name: The refname to delete.
266
 
        :param old_ref: The old sha the refname must refer to, or None to delete
267
 
            unconditionally.
268
 
        :return: True if the delete was successful, False otherwise.
269
 
        """
270
 
        self._check_refname(name)
271
 
        # may only be packed
272
 
        try:
273
 
            self.transport.delete(name)
274
 
        except NoSuchFile:
275
 
            pass
276
 
        self._remove_packed_ref(name)
277
 
        return True
278
 
 
279
 
 
280
 
class TransportRepo(BaseRepo):
281
 
 
282
 
    def __init__(self, transport):
283
 
        self.transport = transport
284
 
        try:
285
 
            if self.transport.has(".git/%s" % OBJECTDIR):
286
 
                self.bare = False
287
 
                self._controltransport = self.transport.clone('.git')
288
 
            elif self.transport.has_any(["info/refs", OBJECTDIR, REFSDIR]):
289
 
                self.bare = True
290
 
                self._controltransport = self.transport
291
 
            else:
292
 
                raise NotGitRepository(self.transport)
293
 
        except NoSuchFile:
294
 
            raise NotGitRepository(self.transport)
295
 
        object_store = TransportObjectStore(
296
 
            self._controltransport.clone(OBJECTDIR))
297
 
        super(TransportRepo, self).__init__(object_store, 
298
 
                TransportRefsContainer(self._controltransport))
299
 
 
300
 
    def get_named_file(self, path):
301
 
        """Get a file from the control dir with a specific name.
302
 
 
303
 
        Although the filename should be interpreted as a filename relative to
304
 
        the control dir in a disk-baked Repo, the object returned need not be
305
 
        pointing to a file in that location.
306
 
 
307
 
        :param path: The path to the file, relative to the control dir.
308
 
        :return: An open file object, or None if the file does not exist.
309
 
        """
310
 
        try:
311
 
            return self._controltransport.get(path.lstrip('/'))
312
 
        except NoSuchFile:
313
 
            return None
314
 
 
315
 
    def index_path(self):
316
 
        """Return the path to the index file."""
317
 
        return self._controltransport.local_abspath(INDEX_FILENAME)
318
 
 
319
 
    def open_index(self):
320
 
        """Open the index for this repository."""
321
 
        from dulwich.index import Index
322
 
        if not self.has_index():
323
 
            raise NoIndexPresent()
324
 
        return Index(self.index_path())
325
 
 
326
 
    def has_index(self):
327
 
        """Check if an index is present."""
328
 
        # Bare repos must never have index files; non-bare repos may have a
329
 
        # missing index file, which is treated as empty.
330
 
        return not self.bare
331
 
 
332
 
    def __repr__(self):
333
 
        return "<%s for %r>" % (self.__class__.__name__, self.transport)
334
 
 
335
 
 
336
 
class TransportObjectStore(PackBasedObjectStore):
337
 
    """Git-style object store that exists on disk."""
338
 
 
339
 
    def __init__(self, transport):
340
 
        """Open an object store.
341
 
 
342
 
        :param transport: Transport to open data from
343
 
        """
344
 
        super(TransportObjectStore, self).__init__()
345
 
        self.transport = transport
346
 
        self.pack_transport = self.transport.clone(PACKDIR)
347
 
 
348
 
    def __repr__(self):
349
 
        return "%s(%r)" % (self.__class__.__name__, self.transport)
350
 
 
351
 
    def _pack_cache_stale(self):
352
 
        return False # FIXME
353
 
 
354
 
    def _pack_names(self):
355
 
        try:
356
 
            f = self.transport.get('info/packs')
357
 
        except NoSuchFile:
358
 
            return self.pack_transport.list_dir(".")
359
 
        else:
360
 
            ret = []
361
 
            for line in f.readlines():
362
 
                line = line.rstrip("\n")
363
 
                if not line:
364
 
                    continue
365
 
                (kind, name) = line.split(" ", 1)
366
 
                if kind != "P":
367
 
                    continue
368
 
                ret.append(name)
369
 
            return ret
370
 
 
371
 
    def _load_packs(self):
372
 
        ret = []
373
 
        for name in self._pack_names():
374
 
            if name.startswith("pack-") and name.endswith(".pack"):
375
 
                try:
376
 
                    size = self.pack_transport.stat(name).st_size
377
 
                except TransportNotPossible:
378
 
                    # FIXME: This reads the whole pack file at once
379
 
                    f = self.pack_transport.get(name)
380
 
                    contents = f.read()
381
 
                    pd = PackData(name, StringIO(contents), size=len(contents))
382
 
                else:
383
 
                    pd = PackData(name, self.pack_transport.get(name),
384
 
                            size=size)
385
 
                idxname = name.replace(".pack", ".idx")
386
 
                idx = load_pack_index_file(idxname, self.pack_transport.get(idxname))
387
 
                pack = Pack.from_objects(pd, idx)
388
 
                ret.append(pack)
389
 
        return ret
390
 
 
391
 
    def _iter_loose_objects(self):
392
 
        for base in self.transport.list_dir('.'):
393
 
            if len(base) != 2:
394
 
                continue
395
 
            for rest in self.transport.list_dir(base):
396
 
                yield base+rest
397
 
 
398
 
    def _split_loose_object(self, sha):
399
 
        return (sha[:2], sha[2:])
400
 
 
401
 
    def _remove_loose_object(self, sha):
402
 
        path = '%s/%s' % self._split_loose_object(sha)
403
 
        self.transport.delete(path)
404
 
 
405
 
    def _get_loose_object(self, sha):
406
 
        path = '%s/%s' % self._split_loose_object(sha)
407
 
        try:
408
 
            return ShaFile.from_file(self.transport.get(path))
409
 
        except NoSuchFile:
410
 
            return None
411
 
 
412
 
    def add_object(self, obj):
413
 
        """Add a single object to this object store.
414
 
 
415
 
        :param obj: Object to add
416
 
        """
417
 
        (dir, file) = self._split_loose_object(obj.id)
418
 
        try:
419
 
            self.transport.mkdir(dir)
420
 
        except FileExists:
421
 
            pass
422
 
        path = "%s/%s" % (dir, file)
423
 
        if self.transport.has(path):
424
 
            return # Already there, no need to write again
425
 
        self.transport.put_bytes(path, obj.as_legacy_object())
426
 
 
427
 
    def move_in_pack(self, f):
428
 
        """Move a specific file containing a pack into the pack directory.
429
 
 
430
 
        :note: The file should be on the same file system as the
431
 
            packs directory.
432
 
 
433
 
        :param path: Path to the pack file.
434
 
        """
435
 
        f.seek(0)
436
 
        p = PackData(None, f, len(f.getvalue()))
437
 
        entries = p.sorted_entries()
438
 
        basename = "pack-%s" % iter_sha1(entry[0] for entry in entries)
439
 
        f.seek(0)
440
 
        self.pack_transport.put_file(basename + ".pack", f)
441
 
        idxfile = self.pack_transport.open_write_stream(basename + ".idx")
442
 
        try:
443
 
            write_pack_index_v2(idxfile, entries, p.get_stored_checksum())
444
 
        finally:
445
 
            idxfile.close()
446
 
        idxfile = self.pack_transport.get(basename + ".idx")
447
 
        idx = load_pack_index_file(basename+".idx", idxfile)
448
 
        final_pack = Pack.from_objects(p, idx)
449
 
        self._add_known_pack(final_pack)
450
 
        return final_pack
451
 
 
452
 
    def add_thin_pack(self):
453
 
        """Add a new thin pack to this object store.
454
 
 
455
 
        Thin packs are packs that contain deltas with parents that exist
456
 
        in a different pack.
457
 
        """
458
 
        from cStringIO import StringIO
459
 
        f = StringIO()
460
 
        def commit():
461
 
            if len(f.getvalue()) > 0:
462
 
                return self.move_in_thin_pack(f)
463
 
            else:
464
 
                return None
465
 
        return f, commit
466
 
 
467
 
    def move_in_thin_pack(self, f):
468
 
        """Move a specific file containing a pack into the pack directory.
469
 
 
470
 
        :note: The file should be on the same file system as the
471
 
            packs directory.
472
 
 
473
 
        :param path: Path to the pack file.
474
 
        """
475
 
        f.seek(0)
476
 
        data = ThinPackData.from_file(self.get_raw, f, len(f.getvalue()))
477
 
        idx = MemoryPackIndex(data.sorted_entries(), data.get_stored_checksum())
478
 
        p = Pack.from_objects(data, idx)
479
 
 
480
 
        pack_sha = idx.objects_sha1()
481
 
 
482
 
        datafile = self.pack_transport.open_write_stream("pack-%s.pack" % pack_sha)
483
 
        try:
484
 
            entries, data_sum = write_pack_data(datafile, ((o, None) for o in p.iterobjects()), len(p))
485
 
        finally:
486
 
            datafile.close()
487
 
        entries.sort()
488
 
        idxfile = self.pack_transport.open_write_stream("pack-%s.idx" % pack_sha)
489
 
        try:
490
 
            write_pack_index_v2(idxfile, data.sorted_entries(), data_sum)
491
 
        finally:
492
 
            idxfile.close()
493
 
        final_pack = Pack("pack-%s" % pack_sha)
494
 
        self._add_known_pack(final_pack)
495
 
        return final_pack
496
 
 
497
 
 
498
 
 
499
 
    def add_pack(self):
500
 
        """Add a new pack to this object store. 
501
 
 
502
 
        :return: Fileobject to write to and a commit function to 
503
 
            call when the pack is finished.
504
 
        """
505
 
        from cStringIO import StringIO
506
 
        f = StringIO()
507
 
        def commit():
508
 
            if len(f.getvalue()) > 0:
509
 
                return self.move_in_pack(f)
510
 
            else:
511
 
                return None
512
 
        return f, commit
513
 
 
514
 
    @classmethod
515
 
    def init(cls, transport):
516
 
        transport.mkdir('info')
517
 
        transport.mkdir(PACKDIR)
518
 
        return cls(transport)