/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2006-04-24 10:31:28 UTC
  • mfrom: (1684.1.2 bzr.mbp.integration)
  • Revision ID: pqm@pqm.ubuntu.com-20060424103128-a637f56a7c529bad
(mbp) tutorial improvements

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005-2010 Canonical Ltd
2
 
#
 
1
# Copyright (C) 2004, 2005 by Canonical Ltd
 
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
#
 
7
 
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
#
 
12
 
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
from __future__ import absolute_import
18
17
 
19
18
# mbp: "you know that thing where cvs gives you conflict markers?"
20
19
# s: "i hate that."
21
20
 
22
 
import patiencediff
23
 
 
24
 
 
25
 
from . import (
26
 
    errors,
27
 
    textfile,
28
 
    )
29
 
 
30
 
 
31
 
class CantReprocessAndShowBase(errors.BzrError):
32
 
 
33
 
    _fmt = ("Can't reprocess and show base, because reprocessing obscures "
34
 
            "the relationship of conflicting lines to the base")
35
 
 
 
21
 
 
22
from difflib import SequenceMatcher
 
23
 
 
24
from bzrlib.errors import CantReprocessAndShowBase
 
25
from bzrlib.textfile import check_text_lines
36
26
 
37
27
def intersect(ra, rb):
38
28
    """Given two ranges return the range where they intersect or None.
46
36
    >>> intersect((0, 9), (7, 15))
47
37
    (7, 9)
48
38
    """
49
 
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
50
 
 
 
39
    assert ra[0] <= ra[1]
 
40
    assert rb[0] <= rb[1]
 
41
    
51
42
    sa = max(ra[0], rb[0])
52
43
    sb = min(ra[1], rb[1])
53
44
    if sa < sb:
59
50
def compare_range(a, astart, aend, b, bstart, bend):
60
51
    """Compare a[astart:aend] == b[bstart:bend], without slicing.
61
52
    """
62
 
    if (aend - astart) != (bend - bstart):
 
53
    if (aend-astart) != (bend-bstart):
63
54
        return False
64
 
    for ia, ib in zip(range(astart, aend), range(bstart, bend)):
 
55
    for ia, ib in zip(xrange(astart, aend), xrange(bstart, bend)):
65
56
        if a[ia] != b[ib]:
66
57
            return False
67
58
    else:
68
59
        return True
 
60
        
 
61
 
69
62
 
70
63
 
71
64
class Merge3(object):
74
67
    Given BASE, OTHER, THIS, tries to produce a combined text
75
68
    incorporating the changes from both BASE->OTHER and BASE->THIS.
76
69
    All three will typically be sequences of lines."""
77
 
 
78
 
    def __init__(self, base, a, b, is_cherrypick=False, allow_objects=False):
79
 
        """Constructor.
80
 
 
81
 
        :param base: lines in BASE
82
 
        :param a: lines in A
83
 
        :param b: lines in B
84
 
        :param is_cherrypick: flag indicating if this merge is a cherrypick.
85
 
            When cherrypicking b => a, matches with b and base do not conflict.
86
 
        :param allow_objects: if True, do not require that base, a and b are
87
 
            plain Python strs.  Also prevents BinaryFile from being raised.
88
 
            Lines can be any sequence of comparable and hashable Python
89
 
            objects.
90
 
        """
91
 
        if not allow_objects:
92
 
            textfile.check_text_lines(base)
93
 
            textfile.check_text_lines(a)
94
 
            textfile.check_text_lines(b)
 
70
    def __init__(self, base, a, b):
 
71
        check_text_lines(base)
 
72
        check_text_lines(a)
 
73
        check_text_lines(b)
95
74
        self.base = base
96
75
        self.a = a
97
76
        self.b = b
98
 
        self.is_cherrypick = is_cherrypick
 
77
 
 
78
 
99
79
 
100
80
    def merge_lines(self,
101
81
                    name_a=None,
102
82
                    name_b=None,
103
83
                    name_base=None,
104
 
                    start_marker=b'<<<<<<<',
105
 
                    mid_marker=b'=======',
106
 
                    end_marker=b'>>>>>>>',
 
84
                    start_marker='<<<<<<<',
 
85
                    mid_marker='=======',
 
86
                    end_marker='>>>>>>>',
107
87
                    base_marker=None,
108
88
                    reprocess=False):
109
89
        """Return merge in cvs-like form.
110
90
        """
111
 
        newline = b'\n'
112
 
        if len(self.a) > 0:
113
 
            if self.a[0].endswith(b'\r\n'):
114
 
                newline = b'\r\n'
115
 
            elif self.a[0].endswith(b'\r'):
116
 
                newline = b'\r'
117
91
        if base_marker and reprocess:
118
92
            raise CantReprocessAndShowBase()
119
93
        if name_a:
120
 
            start_marker = start_marker + b' ' + name_a
 
94
            start_marker = start_marker + ' ' + name_a
121
95
        if name_b:
122
 
            end_marker = end_marker + b' ' + name_b
 
96
            end_marker = end_marker + ' ' + name_b
123
97
        if name_base and base_marker:
124
 
            base_marker = base_marker + b' ' + name_base
 
98
            base_marker = base_marker + ' ' + name_base
125
99
        merge_regions = self.merge_regions()
126
100
        if reprocess is True:
127
101
            merge_regions = self.reprocess_merge_regions(merge_regions)
137
111
                for i in range(t[1], t[2]):
138
112
                    yield self.b[i]
139
113
            elif what == 'conflict':
140
 
                yield start_marker + newline
 
114
                yield start_marker + '\n'
141
115
                for i in range(t[3], t[4]):
142
116
                    yield self.a[i]
143
117
                if base_marker is not None:
144
 
                    yield base_marker + newline
 
118
                    yield base_marker + '\n'
145
119
                    for i in range(t[1], t[2]):
146
120
                        yield self.base[i]
147
 
                yield mid_marker + newline
 
121
                yield mid_marker + '\n'
148
122
                for i in range(t[5], t[6]):
149
123
                    yield self.b[i]
150
 
                yield end_marker + newline
 
124
                yield end_marker + '\n'
151
125
            else:
152
126
                raise ValueError(what)
 
127
        
 
128
        
 
129
 
 
130
 
153
131
 
154
132
    def merge_annotated(self):
155
133
        """Return merge with conflicts, showing origin of lines.
156
134
 
157
 
        Most useful for debugging merge.
 
135
        Most useful for debugging merge.        
158
136
        """
159
137
        for t in self.merge_regions():
160
138
            what = t[0]
177
155
                yield '>>>>\n'
178
156
            else:
179
157
                raise ValueError(what)
 
158
        
 
159
        
 
160
 
 
161
 
180
162
 
181
163
    def merge_groups(self):
182
164
        """Yield sequence of line groups.  Each one is a tuple:
212
194
            else:
213
195
                raise ValueError(what)
214
196
 
 
197
 
215
198
    def merge_regions(self):
216
199
        """Return sequences of matching and conflicting regions.
217
200
 
241
224
 
242
225
        # section a[0:ia] has been disposed of, etc
243
226
        iz = ia = ib = 0
244
 
 
 
227
        
245
228
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
 
229
            #print 'match base [%d:%d]' % (zmatch, zend)
 
230
            
246
231
            matchlen = zend - zmatch
247
 
            # invariants:
248
 
            #   matchlen >= 0
249
 
            #   matchlen == (aend - amatch)
250
 
            #   matchlen == (bend - bmatch)
 
232
            assert matchlen >= 0
 
233
            assert matchlen == (aend - amatch)
 
234
            assert matchlen == (bend - bmatch)
 
235
            
251
236
            len_a = amatch - ia
252
237
            len_b = bmatch - ib
253
 
            # invariants:
254
 
            # assert len_a >= 0
255
 
            # assert len_b >= 0
 
238
            len_base = zmatch - iz
 
239
            assert len_a >= 0
 
240
            assert len_b >= 0
 
241
            assert len_base >= 0
256
242
 
257
 
            # print 'unmatched a=%d, b=%d' % (len_a, len_b)
 
243
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
258
244
 
259
245
            if len_a or len_b:
260
246
                # try to avoid actually slicing the lists
 
247
                equal_a = compare_range(self.a, ia, amatch,
 
248
                                        self.base, iz, zmatch)
 
249
                equal_b = compare_range(self.b, ib, bmatch,
 
250
                                        self.base, iz, zmatch)
261
251
                same = compare_range(self.a, ia, amatch,
262
252
                                     self.b, ib, bmatch)
263
253
 
264
254
                if same:
265
255
                    yield 'same', ia, amatch
 
256
                elif equal_a and not equal_b:
 
257
                    yield 'b', ib, bmatch
 
258
                elif equal_b and not equal_a:
 
259
                    yield 'a', ia, amatch
 
260
                elif not equal_a and not equal_b:
 
261
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
266
262
                else:
267
 
                    equal_a = compare_range(self.a, ia, amatch,
268
 
                                            self.base, iz, zmatch)
269
 
                    equal_b = compare_range(self.b, ib, bmatch,
270
 
                                            self.base, iz, zmatch)
271
 
                    if equal_a and not equal_b:
272
 
                        yield 'b', ib, bmatch
273
 
                    elif equal_b and not equal_a:
274
 
                        yield 'a', ia, amatch
275
 
                    elif not equal_a and not equal_b:
276
 
                        if self.is_cherrypick:
277
 
                            for node in self._refine_cherrypick_conflict(
278
 
                                    iz, zmatch, ia, amatch,
279
 
                                    ib, bmatch):
280
 
                                yield node
281
 
                        else:
282
 
                            yield ('conflict', iz, zmatch, ia, amatch, ib,
283
 
                                   bmatch)
284
 
                    else:
285
 
                        raise AssertionError(
286
 
                            "can't handle a=b=base but unmatched")
 
263
                    raise AssertionError("can't handle a=b=base but unmatched")
287
264
 
288
265
                ia = amatch
289
266
                ib = bmatch
292
269
            # if the same part of the base was deleted on both sides
293
270
            # that's OK, we can just skip it.
294
271
 
 
272
                
295
273
            if matchlen > 0:
296
 
                # invariants:
297
 
                # assert ia == amatch
298
 
                # assert ib == bmatch
299
 
                # assert iz == zmatch
300
 
 
 
274
                assert ia == amatch
 
275
                assert ib == bmatch
 
276
                assert iz == zmatch
 
277
                
301
278
                yield 'unchanged', zmatch, zend
302
279
                iz = zend
303
280
                ia = aend
304
281
                ib = bend
305
 
 
306
 
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart,
307
 
                                    bend):
308
 
        """When cherrypicking b => a, ignore matches with b and base."""
309
 
        # Do not emit regions which match, only regions which do not match
310
 
        matches = patiencediff.PatienceSequenceMatcher(
311
 
            None, self.base[zstart:zend], self.b[bstart:bend]
312
 
            ).get_matching_blocks()
313
 
        last_base_idx = 0
314
 
        last_b_idx = 0
315
 
        last_b_idx = 0
316
 
        yielded_a = False
317
 
        for base_idx, b_idx, match_len in matches:
318
 
            conflict_b_len = b_idx - last_b_idx
319
 
            if conflict_b_len == 0:
320
 
                # There are no lines in b which conflict, so skip it
321
 
                pass
322
 
            else:
323
 
                if yielded_a:
324
 
                    yield ('conflict',
325
 
                           zstart + last_base_idx, zstart + base_idx,
326
 
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
327
 
                else:
328
 
                    # The first conflict gets the a-range
329
 
                    yielded_a = True
330
 
                    yield ('conflict', zstart + last_base_idx, zstart +
331
 
                           base_idx,
332
 
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
333
 
            last_base_idx = base_idx + match_len
334
 
            last_b_idx = b_idx + match_len
335
 
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
336
 
            if yielded_a:
337
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
338
 
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
339
 
            else:
340
 
                # The first conflict gets the a-range
341
 
                yielded_a = True
342
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
343
 
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
344
 
        if not yielded_a:
345
 
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
 
282
    
346
283
 
347
284
    def reprocess_merge_regions(self, merge_regions):
348
285
        """Where there are conflict regions, remove the agreed lines.
349
286
 
350
 
        Lines where both A and B have made the same changes are
 
287
        Lines where both A and B have made the same changes are 
351
288
        eliminated.
352
289
        """
353
290
        for region in merge_regions:
357
294
            type, iz, zmatch, ia, amatch, ib, bmatch = region
358
295
            a_region = self.a[ia:amatch]
359
296
            b_region = self.b[ib:bmatch]
360
 
            matches = patiencediff.PatienceSequenceMatcher(
361
 
                None, a_region, b_region).get_matching_blocks()
 
297
            matches = SequenceMatcher(None, a_region, 
 
298
                                      b_region).get_matching_blocks()
362
299
            next_a = ia
363
300
            next_b = ib
364
301
            for region_ia, region_ib, region_len in matches[:-1]:
368
305
                                           region_ib)
369
306
                if reg is not None:
370
307
                    yield reg
371
 
                yield 'same', region_ia, region_len + region_ia
 
308
                yield 'same', region_ia, region_len+region_ia
372
309
                next_a = region_ia + region_len
373
310
                next_b = region_ib + region_len
374
311
            reg = self.mismatch_region(next_a, amatch, next_b, bmatch)
375
312
            if reg is not None:
376
313
                yield reg
377
314
 
 
315
 
378
316
    @staticmethod
379
 
    def mismatch_region(next_a, region_ia, next_b, region_ib):
 
317
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
380
318
        if next_a < region_ia or next_b < region_ib:
381
319
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
 
320
            
382
321
 
383
322
    def find_sync_regions(self):
384
323
        """Return a list of sync regions, where both descendents match the base.
388
327
        """
389
328
 
390
329
        ia = ib = 0
391
 
        amatches = patiencediff.PatienceSequenceMatcher(
392
 
            None, self.base, self.a).get_matching_blocks()
393
 
        bmatches = patiencediff.PatienceSequenceMatcher(
394
 
            None, self.base, self.b).get_matching_blocks()
 
330
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
 
331
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
395
332
        len_a = len(amatches)
396
333
        len_b = len(bmatches)
397
334
 
403
340
 
404
341
            # there is an unconflicted block at i; how long does it
405
342
            # extend?  until whichever one ends earlier.
406
 
            i = intersect((abase, abase + alen), (bbase, bbase + blen))
 
343
            i = intersect((abase, abase+alen), (bbase, bbase+blen))
407
344
            if i:
408
345
                intbase = i[0]
409
346
                intend = i[1]
411
348
 
412
349
                # found a match of base[i[0], i[1]]; this may be less than
413
350
                # the region that matches in either one
414
 
                # assert intlen <= alen
415
 
                # assert intlen <= blen
416
 
                # assert abase <= intbase
417
 
                # assert bbase <= intbase
 
351
                assert intlen <= alen
 
352
                assert intlen <= blen
 
353
                assert abase <= intbase
 
354
                assert bbase <= intbase
418
355
 
419
356
                asub = amatch + (intbase - abase)
420
357
                bsub = bmatch + (intbase - bbase)
421
358
                aend = asub + intlen
422
359
                bend = bsub + intlen
423
360
 
424
 
                # assert self.base[intbase:intend] == self.a[asub:aend], \
425
 
                #       (self.base[intbase:intend], self.a[asub:aend])
426
 
                # assert self.base[intbase:intend] == self.b[bsub:bend]
 
361
                assert self.base[intbase:intend] == self.a[asub:aend], \
 
362
                       (self.base[intbase:intend], self.a[asub:aend])
 
363
 
 
364
                assert self.base[intbase:intend] == self.b[bsub:bend]
427
365
 
428
366
                sl.append((intbase, intend,
429
367
                           asub, aend,
430
368
                           bsub, bend))
 
369
 
431
370
            # advance whichever one ends first in the base text
432
371
            if (abase + alen) < (bbase + blen):
433
372
                ia += 1
434
373
            else:
435
374
                ib += 1
436
 
 
 
375
            
437
376
        intbase = len(self.base)
438
377
        abase = len(self.a)
439
378
        bbase = len(self.b)
441
380
 
442
381
        return sl
443
382
 
 
383
 
 
384
 
444
385
    def find_unconflicted(self):
445
386
        """Return a list of ranges in base that are not conflicted."""
446
 
        am = patiencediff.PatienceSequenceMatcher(
447
 
            None, self.base, self.a).get_matching_blocks()
448
 
        bm = patiencediff.PatienceSequenceMatcher(
449
 
            None, self.base, self.b).get_matching_blocks()
 
387
 
 
388
        import re
 
389
 
 
390
        # don't sync-up on lines containing only blanks or pounds
 
391
        junk_re = re.compile(r'^[ \t#]*$')
 
392
        
 
393
        am = SequenceMatcher(junk_re.match, self.base, self.a).get_matching_blocks()
 
394
        bm = SequenceMatcher(junk_re.match, self.base, self.b).get_matching_blocks()
450
395
 
451
396
        unc = []
452
397
 
465
410
                del am[0]
466
411
            else:
467
412
                del bm[0]
468
 
 
 
413
                
469
414
        return unc
470
415
 
471
416
 
472
417
def main(argv):
473
418
    # as for diff3 and meld the syntax is "MINE BASE OTHER"
474
 
    with open(argv[1], 'rt') as f:
475
 
        a = f.readlines()
476
 
    with open(argv[2], 'rt') as f:
477
 
        base = f.readlines()
478
 
    with open(argv[3], 'rt') as f:
479
 
        b = f.readlines()
 
419
    a = file(argv[1], 'rt').readlines()
 
420
    base = file(argv[2], 'rt').readlines()
 
421
    b = file(argv[3], 'rt').readlines()
480
422
 
481
423
    m3 = Merge3(base, a, b)
482
424
 
483
 
    # for sr in m3.find_sync_regions():
 
425
    #for sr in m3.find_sync_regions():
484
426
    #    print sr
485
427
 
486
428
    # sys.stdout.writelines(m3.merge_lines(name_a=argv[1], name_b=argv[3]))