/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to breezy/bzr/weave.py

  • Committer: Jelmer Vernooij
  • Date: 2018-06-15 13:10:28 UTC
  • mto: (6973.12.2 python3-k)
  • mto: This revision was merged to the branch mainline in revision 6993.
  • Revision ID: jelmer@jelmer.uk-20180615131028-abolpmqrid8th0cd
More bees.

Show diffs side-by-side

added added

removed removed

Lines of Context:
16
16
 
17
17
# Author: Martin Pool <mbp@canonical.com>
18
18
 
19
 
 
20
19
"""Weave - storage of related text file versions"""
21
20
 
 
21
from __future__ import absolute_import
22
22
 
23
23
# XXX: If we do weaves this way, will a merge still behave the same
24
24
# way if it's done in a different order?  That's a pretty desirable
67
67
# FIXME: the conflict markers should be *7* characters
68
68
 
69
69
from copy import copy
70
 
from cStringIO import StringIO
71
70
import os
72
71
 
73
 
from bzrlib.lazy_import import lazy_import
 
72
from ..lazy_import import lazy_import
74
73
lazy_import(globals(), """
75
 
from bzrlib import tsort
 
74
from breezy import tsort
76
75
""")
77
 
from bzrlib import (
 
76
from .. import (
78
77
    errors,
79
78
    osutils,
80
79
    )
81
 
from bzrlib.errors import (WeaveError, WeaveFormatError, WeaveParentMismatch,
82
 
        RevisionAlreadyPresent,
83
 
        RevisionNotPresent,
84
 
        UnavailableRepresentation,
85
 
        )
86
 
from bzrlib.osutils import dirname, sha, sha_strings, split_lines
87
 
import bzrlib.patiencediff
88
 
from bzrlib.revision import NULL_REVISION
89
 
from bzrlib.symbol_versioning import *
90
 
from bzrlib.trace import mutter
91
 
from bzrlib.versionedfile import (
 
80
from ..errors import (
 
81
    RevisionAlreadyPresent,
 
82
    RevisionNotPresent,
 
83
    UnavailableRepresentation,
 
84
    )
 
85
from ..osutils import dirname, sha, sha_strings, split_lines
 
86
from .. import patiencediff
 
87
from ..revision import NULL_REVISION
 
88
from ..sixish import (
 
89
    BytesIO,
 
90
    )
 
91
from ..trace import mutter
 
92
from .versionedfile import (
92
93
    AbsentContentFactory,
93
94
    adapter_registry,
94
95
    ContentFactory,
95
96
    sort_groupcompress,
96
97
    VersionedFile,
97
98
    )
98
 
from bzrlib.weavefile import _read_weave_v5, write_weave_v5
 
99
from .weavefile import _read_weave_v5, write_weave_v5
 
100
 
 
101
 
 
102
class WeaveError(errors.BzrError):
 
103
 
 
104
    _fmt = "Error in processing weave: %(msg)s"
 
105
 
 
106
    def __init__(self, msg=None):
 
107
        errors.BzrError.__init__(self)
 
108
        self.msg = msg
 
109
 
 
110
 
 
111
class WeaveRevisionAlreadyPresent(WeaveError):
 
112
 
 
113
    _fmt = "Revision {%(revision_id)s} already present in %(weave)s"
 
114
 
 
115
    def __init__(self, revision_id, weave):
 
116
 
 
117
        WeaveError.__init__(self)
 
118
        self.revision_id = revision_id
 
119
        self.weave = weave
 
120
 
 
121
 
 
122
class WeaveRevisionNotPresent(WeaveError):
 
123
 
 
124
    _fmt = "Revision {%(revision_id)s} not present in %(weave)s"
 
125
 
 
126
    def __init__(self, revision_id, weave):
 
127
        WeaveError.__init__(self)
 
128
        self.revision_id = revision_id
 
129
        self.weave = weave
 
130
 
 
131
 
 
132
class WeaveFormatError(WeaveError):
 
133
 
 
134
    _fmt = "Weave invariant violated: %(what)s"
 
135
 
 
136
    def __init__(self, what):
 
137
        WeaveError.__init__(self)
 
138
        self.what = what
 
139
 
 
140
 
 
141
class WeaveParentMismatch(WeaveError):
 
142
 
 
143
    _fmt = "Parents are mismatched between two revisions. %(msg)s"
 
144
 
 
145
 
 
146
class WeaveInvalidChecksum(WeaveError):
 
147
 
 
148
    _fmt = "Text did not match its checksum: %(msg)s"
 
149
 
 
150
 
 
151
class WeaveTextDiffers(WeaveError):
 
152
 
 
153
    _fmt = ("Weaves differ on text content. Revision:"
 
154
            " {%(revision_id)s}, %(weave_a)s, %(weave_b)s")
 
155
 
 
156
    def __init__(self, revision_id, weave_a, weave_b):
 
157
        WeaveError.__init__(self)
 
158
        self.revision_id = revision_id
 
159
        self.weave_a = weave_a
 
160
        self.weave_b = weave_b
 
161
 
 
162
 
 
163
class WeaveTextDiffers(WeaveError):
 
164
 
 
165
    _fmt = ("Weaves differ on text content. Revision:"
 
166
            " {%(revision_id)s}, %(weave_a)s, %(weave_b)s")
 
167
 
 
168
    def __init__(self, revision_id, weave_a, weave_b):
 
169
        WeaveError.__init__(self)
 
170
        self.revision_id = revision_id
 
171
        self.weave_a = weave_a
 
172
        self.weave_b = weave_b
99
173
 
100
174
 
101
175
class WeaveContentFactory(ContentFactory):
231
305
        self._name_map = {}
232
306
        self._weave_name = weave_name
233
307
        if matcher is None:
234
 
            self._matcher = bzrlib.patiencediff.PatienceSequenceMatcher
 
308
            self._matcher = patiencediff.PatienceSequenceMatcher
235
309
        else:
236
310
            self._matcher = matcher
237
311
        if get_scope is None:
391
465
    def _add_lines(self, version_id, parents, lines, parent_texts,
392
466
       left_matching_blocks, nostore_sha, random_id, check_content):
393
467
        """See VersionedFile.add_lines."""
394
 
        idx = self._add(version_id, lines, map(self._lookup, parents),
 
468
        idx = self._add(version_id, lines, list(map(self._lookup, parents)),
395
469
            nostore_sha=nostore_sha)
396
470
        return sha_strings(lines), sum(map(len, lines)), idx
397
471
 
420
494
        if sha1 == nostore_sha:
421
495
            raise errors.ExistingContent
422
496
        if version_id is None:
423
 
            version_id = "sha1:" + sha1
 
497
            version_id = b"sha1:" + sha1
424
498
        if version_id in self._name_map:
425
499
            return self._check_repeated_add(version_id, parents, lines, sha1)
426
500
 
427
501
        self._check_versions(parents)
428
 
        ## self._check_lines(lines)
429
502
        new_version = len(self._parents)
430
503
 
431
504
        # if we abort after here the (in-memory) weave will be corrupt because only
437
510
        self._names.append(version_id)
438
511
        self._name_map[version_id] = new_version
439
512
 
440
 
 
441
513
        if not parents:
442
514
            # special case; adding with no parents revision; can do
443
515
            # this more quickly by just appending unconditionally.
444
516
            # even more specially, if we're adding an empty text we
445
517
            # need do nothing at all.
446
518
            if lines:
447
 
                self._weave.append(('{', new_version))
 
519
                self._weave.append((b'{', new_version))
448
520
                self._weave.extend(lines)
449
 
                self._weave.append(('}', None))
 
521
                self._weave.append((b'}', None))
450
522
            return new_version
451
523
 
452
524
        if len(parents) == 1:
500
572
            # the deletion and insertion are handled separately.
501
573
            # first delete the region.
502
574
            if i1 != i2:
503
 
                self._weave.insert(i1+offset, ('[', new_version))
504
 
                self._weave.insert(i2+offset+1, (']', new_version))
 
575
                self._weave.insert(i1+offset, (b'[', new_version))
 
576
                self._weave.insert(i2+offset+1, (b']', new_version))
505
577
                offset += 2
506
578
 
507
579
            if j1 != j2:
509
581
                # i2; we want to insert after this region to make sure
510
582
                # we don't destroy ourselves
511
583
                i = i2 + offset
512
 
                self._weave[i:i] = ([('{', new_version)]
 
584
                self._weave[i:i] = ([(b'{', new_version)]
513
585
                                    + lines[j1:j2]
514
 
                                    + [('}', None)])
 
586
                                    + [(b'}', None)])
515
587
                offset += 2 + (j2 - j1)
516
588
        return new_version
517
589
 
520
592
        if not len(versions):
521
593
            return []
522
594
        i = set(versions)
523
 
        for v in xrange(max(versions), 0, -1):
 
595
        for v in range(max(versions), 0, -1):
524
596
            if v in i:
525
597
                # include all its parents
526
598
                i.update(self._parents[v])
527
599
        return i
528
 
        ## except IndexError:
529
 
        ##     raise ValueError("version %d not present in weave" % v)
530
600
 
531
601
    def get_ancestry(self, version_ids, topo_sorted=True):
532
602
        """See VersionedFile.get_ancestry."""
533
 
        if isinstance(version_ids, basestring):
 
603
        if isinstance(version_ids, bytes):
534
604
            version_ids = [version_ids]
535
605
        i = self._inclusions([self._lookup(v) for v in version_ids])
536
606
        return [self._idx_to_name(v) for v in i]
537
607
 
538
 
    def _check_lines(self, text):
539
 
        if not isinstance(text, list):
540
 
            raise ValueError("text should be a list, not %s" % type(text))
541
 
 
542
 
        for l in text:
543
 
            if not isinstance(l, basestring):
544
 
                raise ValueError("text line should be a string or unicode, not %s"
545
 
                                 % type(l))
546
 
 
547
 
 
548
 
 
549
608
    def _check_versions(self, indexes):
550
609
        """Check everything in the sequence of indexes is valid"""
551
610
        for i in indexes:
578
637
        version_ids = set(version_ids)
579
638
        for lineno, inserted, deletes, line in self._walk_internal(version_ids):
580
639
            if inserted not in version_ids: continue
581
 
            if line[-1] != '\n':
582
 
                yield line + '\n', inserted
 
640
            if not line.endswith(b'\n'):
 
641
                yield line + b'\n', inserted
583
642
            else:
584
643
                yield line, inserted
585
644
 
595
654
            if l.__class__ == tuple:
596
655
                c, v = l
597
656
                isactive = None
598
 
                if c == '{':
 
657
                if c == b'{':
599
658
                    istack.append(self._names[v])
600
 
                elif c == '}':
 
659
                elif c == b'}':
601
660
                    istack.pop()
602
 
                elif c == '[':
 
661
                elif c == b'[':
603
662
                    dset.add(self._names[v])
604
 
                elif c == ']':
 
663
                elif c == b']':
605
664
                    dset.remove(self._names[v])
606
665
                else:
607
666
                    raise WeaveFormatError('unexpected instruction %r' % v)
688
747
        WFE = WeaveFormatError
689
748
 
690
749
        # wow.
691
 
        #  449       0   4474.6820   2356.5590   bzrlib.weave:556(_extract)
 
750
        #  449       0   4474.6820   2356.5590   breezy.weave:556(_extract)
692
751
        #  +285282   0   1676.8040   1676.8040   +<isinstance>
693
752
        # 1.6 seconds in 'isinstance'.
694
753
        # changing the first isinstance:
695
 
        #  449       0   2814.2660   1577.1760   bzrlib.weave:556(_extract)
 
754
        #  449       0   2814.2660   1577.1760   breezy.weave:556(_extract)
696
755
        #  +140414   0    762.8050    762.8050   +<isinstance>
697
756
        # note that the inline time actually dropped (less function calls)
698
757
        # and total processing time was halved.
699
758
        # we're still spending ~1/4 of the method in isinstance though.
700
759
        # so lets hard code the acceptable string classes we expect:
701
 
        #  449       0   1202.9420    786.2930   bzrlib.weave:556(_extract)
 
760
        #  449       0   1202.9420    786.2930   breezy.weave:556(_extract)
702
761
        # +71352     0    377.5560    377.5560   +<method 'append' of 'list'
703
762
        #                                          objects>
704
763
        # yay, down to ~1/4 the initial extract time, and our inline time
705
764
        # has shrunk again, with isinstance no longer dominating.
706
765
        # tweaking the stack inclusion test to use a set gives:
707
 
        #  449       0   1122.8030    713.0080   bzrlib.weave:556(_extract)
 
766
        #  449       0   1122.8030    713.0080   breezy.weave:556(_extract)
708
767
        # +71352     0    354.9980    354.9980   +<method 'append' of 'list'
709
768
        #                                          objects>
710
769
        # - a 5% win, or possibly just noise. However with large istacks that
711
770
        # 'in' test could dominate, so I'm leaving this change in place -
712
771
        # when its fast enough to consider profiling big datasets we can review.
713
772
 
714
 
 
715
 
 
716
 
 
717
773
        for l in self._weave:
718
774
            if l.__class__ == tuple:
719
775
                c, v = l
720
776
                isactive = None
721
 
                if c == '{':
 
777
                if c == b'{':
722
778
                    istack.append(v)
723
779
                    iset.add(v)
724
 
                elif c == '}':
 
780
                elif c == b'}':
725
781
                    iset.remove(istack.pop())
726
 
                elif c == '[':
 
782
                elif c == b'[':
727
783
                    if v in included:
728
784
                        dset.add(v)
729
 
                elif c == ']':
 
785
                elif c == b']':
730
786
                    if v in included:
731
787
                        dset.remove(v)
732
788
                else:
750
806
 
751
807
        NOT FOR PUBLIC USE.
752
808
        """
753
 
        if isinstance(name_or_index, (int, long)):
 
809
        # GZ 2017-04-01: This used to check for long as well, but I don't think
 
810
        # there are python implementations with sys.maxsize > sys.maxint
 
811
        if isinstance(name_or_index, int):
754
812
            return name_or_index
755
813
        else:
756
814
            return self._lookup(name_or_index)
762
820
        expected_sha1 = self._sha1s[int_index]
763
821
        measured_sha1 = sha_strings(result)
764
822
        if measured_sha1 != expected_sha1:
765
 
            raise errors.WeaveInvalidChecksum(
 
823
            raise WeaveInvalidChecksum(
766
824
                    'file %s, revision %s, expected: %s, measured %s'
767
825
                    % (self._weave_name, version_id,
768
826
                       expected_sha1, measured_sha1))
805
863
            name = self._idx_to_name(i)
806
864
            sha1s[name] = sha()
807
865
            texts[name] = []
808
 
            new_inc = set([name])
 
866
            new_inc = {name}
809
867
            for p in self._parents[i]:
810
868
                new_inc.update(inclusions[self._idx_to_name(p)])
811
869
 
836
894
 
837
895
        for i in range(nv):
838
896
            version = self._idx_to_name(i)
839
 
            hd = sha1s[version].hexdigest()
 
897
            hd = sha1s[version].hexdigest().encode()
840
898
            expected = self._sha1s[i]
841
899
            if hd != expected:
842
 
                raise errors.WeaveInvalidChecksum(
 
900
                raise WeaveInvalidChecksum(
843
901
                        "mismatched sha1 for version %s: "
844
902
                        "got %s, expected %s"
845
903
                        % (version, hd, expected))
875
933
        this_idx = self._name_map.get(name, -1)
876
934
        if this_idx != -1:
877
935
            if self._sha1s[this_idx] != other._sha1s[other_idx]:
878
 
                raise errors.WeaveTextDiffers(name, self, other)
 
936
                raise WeaveTextDiffers(name, self, other)
879
937
            self_parents = self._parents[this_idx]
880
938
            other_parents = other._parents[other_idx]
881
 
            n1 = set([self._names[i] for i in self_parents])
882
 
            n2 = set([other._names[i] for i in other_parents])
 
939
            n1 = {self._names[i] for i in self_parents}
 
940
            n2 = {other._names[i] for i in other_parents}
883
941
            if not self._compatible_parents(n1, n2):
884
942
                raise WeaveParentMismatch("inconsistent parents "
885
943
                    "for version {%s}: %s vs %s" % (name, n1, n2))
920
978
        self._transport = transport
921
979
        self._filemode = filemode
922
980
        try:
923
 
            _read_weave_v5(self._transport.get(name + WeaveFile.WEAVE_SUFFIX), self)
 
981
            f = self._transport.get(name + WeaveFile.WEAVE_SUFFIX)
 
982
            _read_weave_v5(BytesIO(f.read()), self)
924
983
        except errors.NoSuchFile:
925
984
            if not create:
926
985
                raise
940
999
    def copy_to(self, name, transport):
941
1000
        """See VersionedFile.copy_to()."""
942
1001
        # as we are all in memory always, just serialise to the new place.
943
 
        sio = StringIO()
 
1002
        sio = BytesIO()
944
1003
        write_weave_v5(self, sio)
945
1004
        sio.seek(0)
946
1005
        transport.put_file(name + WeaveFile.WEAVE_SUFFIX, sio, self._filemode)
948
1007
    def _save(self):
949
1008
        """Save the weave."""
950
1009
        self._check_write_ok()
951
 
        sio = StringIO()
 
1010
        sio = BytesIO()
952
1011
        write_weave_v5(self, sio)
953
1012
        sio.seek(0)
954
1013
        bytes = sio.getvalue()
985
1044
    :param msg: An optional message for the progress
986
1045
    """
987
1046
    wr = Weave()
988
 
    ia = ib = 0
989
 
    queue_a = range(wa.num_versions())
990
 
    queue_b = range(wb.num_versions())
991
1047
    # first determine combined parents of all versions
992
1048
    # map from version name -> all parent names
993
1049
    combined_parents = _reweave_parent_graphs(wa, wb)
994
1050
    mutter("combined parents: %r", combined_parents)
995
 
    order = tsort.topo_sort(combined_parents.iteritems())
 
1051
    order = tsort.topo_sort(combined_parents.items())
996
1052
    mutter("order to reweave: %r", order)
997
1053
 
998
1054
    if pb and not msg:
1012
1068
                    lines = list(difflib.unified_diff(lines, lines_b,
1013
1069
                            wa._weave_name, wb._weave_name))
1014
1070
                    mutter('lines:\n%s', ''.join(lines))
1015
 
                    raise errors.WeaveTextDiffers(name, wa, wb)
 
1071
                    raise WeaveTextDiffers(name, wa, wb)
1016
1072
        else:
1017
1073
            lines = wb.get_lines(name)
1018
1074
        wr._add(name, lines, [wr._lookup(i) for i in combined_parents[name]])