/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to breezy/bundle/bundle_data.py

  • Committer: Jelmer Vernooij
  • Date: 2017-11-21 20:14:44 UTC
  • mfrom: (6821.1.1 ignore-warnings)
  • Revision ID: jelmer@jelmer.uk-20171121201444-dvb7yjku3zwjev83
Merge lp:~jelmer/brz/ignore-warnings.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006 Canonical Ltd
 
1
# Copyright (C) 2005-2010 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
16
16
 
17
17
"""Read in a bundle stream, and process it into a BundleReader object."""
18
18
 
 
19
from __future__ import absolute_import
 
20
 
19
21
import base64
20
 
from cStringIO import StringIO
21
22
import os
22
23
import pprint
23
24
 
24
 
from bzrlib import (
 
25
from .. import (
 
26
    cache_utf8,
25
27
    osutils,
26
28
    timestamp,
27
29
    )
28
 
import bzrlib.errors
29
 
from bzrlib.bundle import apply_bundle
30
 
from bzrlib.errors import (TestamentMismatch, BzrError,
31
 
                           MalformedHeader, MalformedPatches, NotABundle)
32
 
from bzrlib.inventory import (Inventory, InventoryEntry,
33
 
                              InventoryDirectory, InventoryFile,
34
 
                              InventoryLink)
35
 
from bzrlib.osutils import sha_file, sha_string, pathjoin
36
 
from bzrlib.revision import Revision, NULL_REVISION
37
 
from bzrlib.testament import StrictTestament
38
 
from bzrlib.trace import mutter, warning
39
 
import bzrlib.transport
40
 
from bzrlib.tree import Tree
41
 
import bzrlib.urlutils
42
 
from bzrlib.xml5 import serializer_v5
 
30
from . import apply_bundle
 
31
from ..errors import (
 
32
    TestamentMismatch,
 
33
    BzrError,
 
34
    )
 
35
from ..bzr.inventory import (
 
36
    Inventory,
 
37
    InventoryDirectory,
 
38
    InventoryFile,
 
39
    InventoryLink,
 
40
    )
 
41
from ..osutils import sha_string, pathjoin
 
42
from ..revision import Revision, NULL_REVISION
 
43
from ..sixish import (
 
44
    BytesIO,
 
45
    viewitems,
 
46
    )
 
47
from ..testament import StrictTestament
 
48
from ..trace import mutter, warning
 
49
from ..tree import Tree
 
50
from ..bzr.xml5 import serializer_v5
43
51
 
44
52
 
45
53
class RevisionInfo(object):
99
107
        revision_info.timestamp = revision.timestamp
100
108
        revision_info.message = revision.message.split('\n')
101
109
        revision_info.properties = [': '.join(p) for p in
102
 
                                    revision.properties.iteritems()]
 
110
                                    viewitems(revision.properties)]
103
111
        return revision_info
104
112
 
105
113
 
136
144
        split up, based on the assumptions that can be made
137
145
        when information is missing.
138
146
        """
139
 
        from bzrlib.timestamp import unpack_highres_date
 
147
        from breezy.timestamp import unpack_highres_date
140
148
        # Put in all of the guessable information.
141
149
        if not self.timestamp and self.date:
142
150
            self.timestamp, self.timezone = unpack_highres_date(self.date)
206
214
 
207
215
        inv = bundle_tree.inventory
208
216
        self._validate_inventory(inv, revision_id)
209
 
        self._validate_revision(inv, revision_id)
 
217
        self._validate_revision(bundle_tree, revision_id)
210
218
 
211
219
        return bundle_tree
212
220
 
245
253
 
246
254
        count = 0
247
255
        missing = {}
248
 
        for revision_id, sha1 in rev_to_sha.iteritems():
 
256
        for revision_id, sha1 in viewitems(rev_to_sha):
249
257
            if repository.has_revision(revision_id):
250
258
                testament = StrictTestament.from_revision(repository,
251
259
                                                          revision_id)
278
286
        if rev.revision_id != revision_id:
279
287
            raise AssertionError()
280
288
        if sha1 != rev.inventory_sha1:
281
 
            open(',,bogus-inv', 'wb').write(s)
 
289
            f = open(',,bogus-inv', 'wb')
 
290
            try:
 
291
                f.write(s)
 
292
            finally:
 
293
                f.close()
282
294
            warning('Inventory sha hash mismatch for revision %s. %s'
283
295
                    ' != %s' % (revision_id, sha1, rev.inventory_sha1))
284
296
 
285
 
    def _validate_revision(self, inventory, revision_id):
 
297
    def _validate_revision(self, tree, revision_id):
286
298
        """Make sure all revision entries match their checksum."""
287
299
 
288
 
        # This is a mapping from each revision id to it's sha hash
 
300
        # This is a mapping from each revision id to its sha hash
289
301
        rev_to_sha1 = {}
290
302
 
291
303
        rev = self.get_revision(revision_id)
294
306
            raise AssertionError()
295
307
        if not (rev.revision_id == revision_id):
296
308
            raise AssertionError()
297
 
        sha1 = self._testament_sha1(rev, inventory)
 
309
        sha1 = self._testament_sha1(rev, tree)
298
310
        if sha1 != rev_info.sha1:
299
311
            raise TestamentMismatch(rev.revision_id, rev_info.sha1, sha1)
300
312
        if rev.revision_id in rev_to_sha1:
313
325
            if last_changed is not None:
314
326
                # last_changed will be a Unicode string because of how it was
315
327
                # read. Convert it back to utf8.
316
 
                changed_revision_id = osutils.safe_revision_id(last_changed,
317
 
                                                               warn=False)
 
328
                changed_revision_id = cache_utf8.encode(last_changed)
318
329
            else:
319
330
                changed_revision_id = revision_id
320
331
            bundle_tree.note_last_changed(path, changed_revision_id)
327
338
                try:
328
339
                    name, value = info_item.split(':', 1)
329
340
                except ValueError:
330
 
                    raise 'Value %r has no colon' % info_item
 
341
                    raise ValueError('Value %r has no colon' % info_item)
331
342
                if name == 'last-changed':
332
343
                    last_changed = value
333
344
                elif name == 'executable':
389
400
                        ': %r' % extra)
390
401
            # This will be Unicode because of how the stream is read. Turn it
391
402
            # back into a utf8 file_id
392
 
            file_id = osutils.safe_file_id(info[1][8:], warn=False)
 
403
            file_id = cache_utf8.encode(info[1][8:])
393
404
 
394
405
            bundle_tree.note_id(file_id, path, kind)
395
406
            # this will be overridden in extra_info if executable is specified.
458
469
 
459
470
 
460
471
class BundleTree(Tree):
 
472
 
461
473
    def __init__(self, base_tree, revision_id):
462
474
        self.base_tree = base_tree
463
475
        self._renamed = {} # Mapping from old_path => new_path
464
476
        self._renamed_r = {} # new_path => old_path
465
477
        self._new_id = {} # new_path => new_id
466
478
        self._new_id_r = {} # new_id => new_path
467
 
        self._kinds = {} # new_id => kind
 
479
        self._kinds = {} # new_path => kind
468
480
        self._last_changed = {} # new_id => revision_id
469
481
        self._executable = {} # new_id => executable value
470
482
        self.patches = {}
490
502
        """Files that don't exist in base need a new id."""
491
503
        self._new_id[new_path] = new_id
492
504
        self._new_id_r[new_id] = new_path
493
 
        self._kinds[new_id] = kind
 
505
        self._kinds[new_path] = kind
494
506
 
495
507
    def note_last_changed(self, file_id, revision_id):
496
508
        if (file_id in self._last_changed
523
535
        old_path = self._renamed.get(new_path)
524
536
        if old_path is not None:
525
537
            return old_path
526
 
        dirname,basename = os.path.split(new_path)
 
538
        dirname, basename = os.path.split(new_path)
527
539
        # dirname is not '' doesn't work, because
528
540
        # dirname may be a unicode entry, and is
529
541
        # requires the objects to be identical
552
564
            return new_path
553
565
        if new_path in self._renamed:
554
566
            return None
555
 
        dirname,basename = os.path.split(old_path)
 
567
        dirname, basename = os.path.split(old_path)
556
568
        if dirname != '':
557
569
            new_dir = self.new_path(dirname)
558
570
            if new_dir is None:
567
579
            return None
568
580
        return new_path
569
581
 
 
582
    def get_root_id(self):
 
583
        return self.path2id('')
 
584
 
570
585
    def path2id(self, path):
571
586
        """Return the id of the file present at path in the target tree."""
572
587
        file_id = self._new_id.get(path)
577
592
            return None
578
593
        if old_path in self.deleted:
579
594
            return None
580
 
        if getattr(self.base_tree, 'path2id', None) is not None:
581
 
            return self.base_tree.path2id(old_path)
582
 
        else:
583
 
            return self.base_tree.inventory.path2id(old_path)
 
595
        return self.base_tree.path2id(old_path)
584
596
 
585
597
    def id2path(self, file_id):
586
598
        """Return the new path in the target tree of the file with id file_id"""
606
618
        new_path = self.id2path(file_id)
607
619
        return self.base_tree.path2id(new_path)
608
620
 
609
 
    def get_file(self, file_id):
 
621
    def get_file(self, path, file_id=None):
610
622
        """Return a file-like object containing the new contents of the
611
623
        file given by file_id.
612
624
 
614
626
                in the text-store, so that the file contents would
615
627
                then be cached.
616
628
        """
 
629
        if file_id is None:
 
630
            file_id = self.path2id(path)
617
631
        base_id = self.old_contents_id(file_id)
618
632
        if (base_id is not None and
619
 
            base_id != self.base_tree.inventory.root.file_id):
620
 
            patch_original = self.base_tree.get_file(base_id)
 
633
            base_id != self.base_tree.get_root_id()):
 
634
            patch_original = self.base_tree.get_file(
 
635
                    self.base_tree.id2path(base_id), base_id)
621
636
        else:
622
637
            patch_original = None
623
 
        file_patch = self.patches.get(self.id2path(file_id))
 
638
        file_patch = self.patches.get(path)
624
639
        if file_patch is None:
625
640
            if (patch_original is None and
626
 
                self.get_kind(file_id) == 'directory'):
627
 
                return StringIO()
 
641
                self.kind(path, file_id) == 'directory'):
 
642
                return BytesIO()
628
643
            if patch_original is None:
629
644
                raise AssertionError("None: %s" % file_id)
630
645
            return patch_original
634
649
                'Malformed patch for %s, %r' % (file_id, file_patch))
635
650
        return patched_file(file_patch, patch_original)
636
651
 
637
 
    def get_symlink_target(self, file_id):
638
 
        new_path = self.id2path(file_id)
639
 
        try:
640
 
            return self._targets[new_path]
641
 
        except KeyError:
642
 
            return self.base_tree.get_symlink_target(file_id)
643
 
 
644
 
    def get_kind(self, file_id):
645
 
        if file_id in self._kinds:
646
 
            return self._kinds[file_id]
647
 
        return self.base_tree.inventory[file_id].kind
648
 
 
649
 
    def is_executable(self, file_id):
650
 
        path = self.id2path(file_id)
 
652
    def get_symlink_target(self, path, file_id=None):
 
653
        try:
 
654
            return self._targets[path]
 
655
        except KeyError:
 
656
            return self.base_tree.get_symlink_target(path, file_id)
 
657
 
 
658
    def kind(self, path, file_id=None):
 
659
        try:
 
660
            return self._kinds[path]
 
661
        except KeyError:
 
662
            return self.base_tree.kind(path, file_id)
 
663
 
 
664
    def get_file_revision(self, path, file_id=None):
 
665
        if path in self._last_changed:
 
666
            return self._last_changed[path]
 
667
        else:
 
668
            return self.base_tree.get_file_revision(path, file_id)
 
669
 
 
670
    def is_executable(self, path, file_id=None):
651
671
        if path in self._executable:
652
672
            return self._executable[path]
653
673
        else:
654
 
            return self.base_tree.inventory[file_id].executable
 
674
            return self.base_tree.is_executable(path, file_id)
655
675
 
656
 
    def get_last_changed(self, file_id):
657
 
        path = self.id2path(file_id)
 
676
    def get_last_changed(self, path, file_id=None):
658
677
        if path in self._last_changed:
659
678
            return self._last_changed[path]
660
 
        return self.base_tree.inventory[file_id].revision
 
679
        return self.base_tree.get_file_revision(path, file_id)
661
680
 
662
 
    def get_size_and_sha1(self, file_id):
 
681
    def get_size_and_sha1(self, new_path, file_id=None):
663
682
        """Return the size and sha1 hash of the given file id.
664
683
        If the file was not locally modified, this is extracted
665
684
        from the base_tree. Rather than re-reading the file.
666
685
        """
667
 
        new_path = self.id2path(file_id)
668
686
        if new_path is None:
669
687
            return None, None
670
688
        if new_path not in self.patches:
671
689
            # If the entry does not have a patch, then the
672
690
            # contents must be the same as in the base_tree
673
 
            ie = self.base_tree.inventory[file_id]
674
 
            if ie.text_size is None:
675
 
                return ie.text_size, ie.text_sha1
676
 
            return int(ie.text_size), ie.text_sha1
677
 
        fileobj = self.get_file(file_id)
 
691
            base_path = self.base_tree.id2path(file_id)
 
692
            text_size = self.base_tree.get_file_size(base_path, file_id)
 
693
            text_sha1 = self.base_tree.get_file_sha1(base_path, file_id)
 
694
            return text_size, text_sha1
 
695
        fileobj = self.get_file(new_path, file_id)
678
696
        content = fileobj.read()
679
697
        return len(content), sha_string(content)
680
698
 
684
702
        This need to be called before ever accessing self.inventory
685
703
        """
686
704
        from os.path import dirname, basename
687
 
        base_inv = self.base_tree.inventory
688
705
        inv = Inventory(None, self.revision_id)
689
706
 
690
 
        def add_entry(file_id):
691
 
            path = self.id2path(file_id)
692
 
            if path is None:
693
 
                return
 
707
        def add_entry(path, file_id):
694
708
            if path == '':
695
709
                parent_id = None
696
710
            else:
697
711
                parent_path = dirname(path)
698
712
                parent_id = self.path2id(parent_path)
699
713
 
700
 
            kind = self.get_kind(file_id)
701
 
            revision_id = self.get_last_changed(file_id)
 
714
            kind = self.kind(path, file_id)
 
715
            revision_id = self.get_last_changed(path, file_id)
702
716
 
703
717
            name = basename(path)
704
718
            if kind == 'directory':
705
719
                ie = InventoryDirectory(file_id, name, parent_id)
706
720
            elif kind == 'file':
707
721
                ie = InventoryFile(file_id, name, parent_id)
708
 
                ie.executable = self.is_executable(file_id)
 
722
                ie.executable = self.is_executable(path, file_id)
709
723
            elif kind == 'symlink':
710
724
                ie = InventoryLink(file_id, name, parent_id)
711
 
                ie.symlink_target = self.get_symlink_target(file_id)
 
725
                ie.symlink_target = self.get_symlink_target(path, file_id)
712
726
            ie.revision = revision_id
713
727
 
714
 
            if kind in ('directory', 'symlink'):
715
 
                ie.text_size, ie.text_sha1 = None, None
716
 
            else:
717
 
                ie.text_size, ie.text_sha1 = self.get_size_and_sha1(file_id)
718
 
            if (ie.text_size is None) and (kind == 'file'):
719
 
                raise BzrError('Got a text_size of None for file_id %r' % file_id)
 
728
            if kind == 'file':
 
729
                ie.text_size, ie.text_sha1 = self.get_size_and_sha1(
 
730
                        path, file_id)
 
731
                if ie.text_size is None:
 
732
                    raise BzrError(
 
733
                        'Got a text_size of None for file_id %r' % file_id)
720
734
            inv.add(ie)
721
735
 
722
736
        sorted_entries = self.sorted_path_id()
723
737
        for path, file_id in sorted_entries:
724
 
            add_entry(file_id)
 
738
            add_entry(path, file_id)
725
739
 
726
740
        return inv
727
741
 
732
746
    # at that instant
733
747
    inventory = property(_get_inventory)
734
748
 
735
 
    def __iter__(self):
736
 
        for path, entry in self.inventory.iter_entries():
737
 
            yield entry.file_id
 
749
    root_inventory = property(_get_inventory)
 
750
 
 
751
    def all_file_ids(self):
 
752
        return {entry.file_id for path, entry in self.inventory.iter_entries()}
 
753
 
 
754
    def list_files(self, include_root=False, from_dir=None, recursive=True):
 
755
        # The only files returned by this are those from the version
 
756
        inv = self.inventory
 
757
        if from_dir is None:
 
758
            from_dir_id = None
 
759
        else:
 
760
            from_dir_id = inv.path2id(from_dir)
 
761
            if from_dir_id is None:
 
762
                # Directory not versioned
 
763
                return
 
764
        entries = inv.iter_entries(from_dir=from_dir_id, recursive=recursive)
 
765
        if inv.root is not None and not include_root and from_dir is None:
 
766
            # skip the root for compatability with the current apis.
 
767
            next(entries)
 
768
        for path, entry in entries:
 
769
            yield path, 'V', entry.kind, entry.file_id, entry
738
770
 
739
771
    def sorted_path_id(self):
740
772
        paths = []
741
 
        for result in self._new_id.iteritems():
 
773
        for result in viewitems(self._new_id):
742
774
            paths.append(result)
743
 
        for id in self.base_tree:
 
775
        for id in self.base_tree.all_file_ids():
744
776
            path = self.id2path(id)
745
777
            if path is None:
746
778
                continue
751
783
 
752
784
def patched_file(file_patch, original):
753
785
    """Produce a file-like object with the patched version of a text"""
754
 
    from bzrlib.patches import iter_patched
755
 
    from bzrlib.iterablefile import IterableFile
 
786
    from breezy.patches import iter_patched
 
787
    from breezy.iterablefile import IterableFile
756
788
    if file_patch == "":
757
789
        return IterableFile(())
758
790
    # string.splitlines(True) also splits on '\r', but the iter_patched code
759
791
    # only expects to iterate over '\n' style lines
760
792
    return IterableFile(iter_patched(original,
761
 
                StringIO(file_patch).readlines()))
 
793
                BytesIO(file_patch).readlines()))