/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

Only chown() the .bzr.log when creating it, fixing NEWS entry to put it under 2.2b3

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2004, 2005 by Canonical Ltd
2
 
 
 
1
# Copyright (C) 2004, 2005 Canonical Ltd
 
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
 
 
7
#
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
 
 
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
16
16
 
17
17
 
18
18
# mbp: "you know that thing where cvs gives you conflict markers?"
19
19
# s: "i hate that."
20
20
 
21
21
 
 
22
from bzrlib.errors import CantReprocessAndShowBase
 
23
import bzrlib.patiencediff
 
24
from bzrlib.textfile import check_text_lines
 
25
 
22
26
 
23
27
def intersect(ra, rb):
24
28
    """Given two ranges return the range where they intersect or None.
32
36
    >>> intersect((0, 9), (7, 15))
33
37
    (7, 9)
34
38
    """
35
 
    assert ra[0] <= ra[1]
36
 
    assert rb[0] <= rb[1]
37
 
    
 
39
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
 
40
 
38
41
    sa = max(ra[0], rb[0])
39
42
    sb = min(ra[1], rb[1])
40
43
    if sa < sb:
53
56
            return False
54
57
    else:
55
58
        return True
56
 
        
 
59
 
57
60
 
58
61
 
59
62
 
63
66
    Given BASE, OTHER, THIS, tries to produce a combined text
64
67
    incorporating the changes from both BASE->OTHER and BASE->THIS.
65
68
    All three will typically be sequences of lines."""
66
 
    def __init__(self, base, a, b):
 
69
 
 
70
    def __init__(self, base, a, b, is_cherrypick=False, allow_objects=False):
 
71
        """Constructor.
 
72
 
 
73
        :param base: lines in BASE
 
74
        :param a: lines in A
 
75
        :param b: lines in B
 
76
        :param is_cherrypick: flag indicating if this merge is a cherrypick.
 
77
            When cherrypicking b => a, matches with b and base do not conflict.
 
78
        :param allow_objects: if True, do not require that base, a and b are
 
79
            plain Python strs.  Also prevents BinaryFile from being raised.
 
80
            Lines can be any sequence of comparable and hashable Python
 
81
            objects.
 
82
        """
 
83
        if not allow_objects:
 
84
            check_text_lines(base)
 
85
            check_text_lines(a)
 
86
            check_text_lines(b)
67
87
        self.base = base
68
88
        self.a = a
69
89
        self.b = b
70
 
        from difflib import SequenceMatcher
71
 
        self.a_ops = SequenceMatcher(None, base, a).get_opcodes()
72
 
        self.b_ops = SequenceMatcher(None, base, b).get_opcodes()
73
 
 
74
 
 
 
90
        self.is_cherrypick = is_cherrypick
75
91
 
76
92
    def merge_lines(self,
77
93
                    name_a=None,
78
94
                    name_b=None,
79
 
                    start_marker='<<<<<<<<',
80
 
                    mid_marker='========',
81
 
                    end_marker='>>>>>>>>',
82
 
                    show_base=False):
 
95
                    name_base=None,
 
96
                    start_marker='<<<<<<<',
 
97
                    mid_marker='=======',
 
98
                    end_marker='>>>>>>>',
 
99
                    base_marker=None,
 
100
                    reprocess=False):
83
101
        """Return merge in cvs-like form.
84
102
        """
 
103
        newline = '\n'
 
104
        if len(self.a) > 0:
 
105
            if self.a[0].endswith('\r\n'):
 
106
                newline = '\r\n'
 
107
            elif self.a[0].endswith('\r'):
 
108
                newline = '\r'
 
109
        if base_marker and reprocess:
 
110
            raise CantReprocessAndShowBase()
85
111
        if name_a:
86
112
            start_marker = start_marker + ' ' + name_a
87
113
        if name_b:
88
114
            end_marker = end_marker + ' ' + name_b
89
 
            
90
 
        for t in self.merge_regions():
 
115
        if name_base and base_marker:
 
116
            base_marker = base_marker + ' ' + name_base
 
117
        merge_regions = self.merge_regions()
 
118
        if reprocess is True:
 
119
            merge_regions = self.reprocess_merge_regions(merge_regions)
 
120
        for t in merge_regions:
91
121
            what = t[0]
92
122
            if what == 'unchanged':
93
123
                for i in range(t[1], t[2]):
99
129
                for i in range(t[1], t[2]):
100
130
                    yield self.b[i]
101
131
            elif what == 'conflict':
102
 
                yield start_marker + '\n'
 
132
                yield start_marker + newline
103
133
                for i in range(t[3], t[4]):
104
134
                    yield self.a[i]
105
 
                yield mid_marker + '\n'
 
135
                if base_marker is not None:
 
136
                    yield base_marker + newline
 
137
                    for i in range(t[1], t[2]):
 
138
                        yield self.base[i]
 
139
                yield mid_marker + newline
106
140
                for i in range(t[5], t[6]):
107
141
                    yield self.b[i]
108
 
                yield end_marker + '\n'
 
142
                yield end_marker + newline
109
143
            else:
110
144
                raise ValueError(what)
111
 
        
112
 
        
113
 
 
114
 
 
115
145
 
116
146
    def merge_annotated(self):
117
147
        """Return merge with conflicts, showing origin of lines.
118
148
 
119
 
        Most useful for debugging merge.        
 
149
        Most useful for debugging merge.
120
150
        """
121
151
        for t in self.merge_regions():
122
152
            what = t[0]
139
169
                yield '>>>>\n'
140
170
            else:
141
171
                raise ValueError(what)
142
 
        
143
 
        
144
 
 
145
 
 
146
172
 
147
173
    def merge_groups(self):
148
174
        """Yield sequence of line groups.  Each one is a tuple:
178
204
            else:
179
205
                raise ValueError(what)
180
206
 
181
 
 
182
207
    def merge_regions(self):
183
208
        """Return sequences of matching and conflicting regions.
184
209
 
208
233
 
209
234
        # section a[0:ia] has been disposed of, etc
210
235
        iz = ia = ib = 0
211
 
        
 
236
 
212
237
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
213
 
            #print 'match base [%d:%d]' % (zmatch, zend)
214
 
            
215
238
            matchlen = zend - zmatch
216
 
            assert matchlen >= 0
217
 
            assert matchlen == (aend - amatch)
218
 
            assert matchlen == (bend - bmatch)
219
 
            
 
239
            # invariants:
 
240
            #   matchlen >= 0
 
241
            #   matchlen == (aend - amatch)
 
242
            #   matchlen == (bend - bmatch)
220
243
            len_a = amatch - ia
221
244
            len_b = bmatch - ib
222
245
            len_base = zmatch - iz
223
 
            assert len_a >= 0
224
 
            assert len_b >= 0
225
 
            assert len_base >= 0
 
246
            # invariants:
 
247
            # assert len_a >= 0
 
248
            # assert len_b >= 0
 
249
            # assert len_base >= 0
226
250
 
227
251
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
228
252
 
229
253
            if len_a or len_b:
230
254
                # try to avoid actually slicing the lists
231
 
                equal_a = compare_range(self.a, ia, amatch,
232
 
                                        self.base, iz, zmatch)
233
 
                equal_b = compare_range(self.b, ib, bmatch,
234
 
                                        self.base, iz, zmatch)
235
255
                same = compare_range(self.a, ia, amatch,
236
256
                                     self.b, ib, bmatch)
237
257
 
238
258
                if same:
239
259
                    yield 'same', ia, amatch
240
 
                elif equal_a and not equal_b:
241
 
                    yield 'b', ib, bmatch
242
 
                elif equal_b and not equal_a:
243
 
                    yield 'a', ia, amatch
244
 
                elif not equal_a and not equal_b:
245
 
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
246
260
                else:
247
 
                    raise AssertionError("can't handle a=b=base but unmatched")
 
261
                    equal_a = compare_range(self.a, ia, amatch,
 
262
                                            self.base, iz, zmatch)
 
263
                    equal_b = compare_range(self.b, ib, bmatch,
 
264
                                            self.base, iz, zmatch)
 
265
                    if equal_a and not equal_b:
 
266
                        yield 'b', ib, bmatch
 
267
                    elif equal_b and not equal_a:
 
268
                        yield 'a', ia, amatch
 
269
                    elif not equal_a and not equal_b:
 
270
                        if self.is_cherrypick:
 
271
                            for node in self._refine_cherrypick_conflict(
 
272
                                                    iz, zmatch, ia, amatch,
 
273
                                                    ib, bmatch):
 
274
                                yield node
 
275
                        else:
 
276
                            yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
 
277
                    else:
 
278
                        raise AssertionError("can't handle a=b=base but unmatched")
248
279
 
249
280
                ia = amatch
250
281
                ib = bmatch
253
284
            # if the same part of the base was deleted on both sides
254
285
            # that's OK, we can just skip it.
255
286
 
256
 
                
257
287
            if matchlen > 0:
258
 
                assert ia == amatch
259
 
                assert ib == bmatch
260
 
                assert iz == zmatch
261
 
                
 
288
                # invariants:
 
289
                # assert ia == amatch
 
290
                # assert ib == bmatch
 
291
                # assert iz == zmatch
 
292
 
262
293
                yield 'unchanged', zmatch, zend
263
294
                iz = zend
264
295
                ia = aend
265
296
                ib = bend
266
 
        
267
 
 
268
 
        
 
297
 
 
298
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart, bend):
 
299
        """When cherrypicking b => a, ignore matches with b and base."""
 
300
        # Do not emit regions which match, only regions which do not match
 
301
        matches = bzrlib.patiencediff.PatienceSequenceMatcher(None,
 
302
            self.base[zstart:zend], self.b[bstart:bend]).get_matching_blocks()
 
303
        last_base_idx = 0
 
304
        last_b_idx = 0
 
305
        last_b_idx = 0
 
306
        yielded_a = False
 
307
        for base_idx, b_idx, match_len in matches:
 
308
            conflict_z_len = base_idx - last_base_idx
 
309
            conflict_b_len = b_idx - last_b_idx
 
310
            if conflict_b_len == 0: # There are no lines in b which conflict,
 
311
                                    # so skip it
 
312
                pass
 
313
            else:
 
314
                if yielded_a:
 
315
                    yield ('conflict',
 
316
                           zstart + last_base_idx, zstart + base_idx,
 
317
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
 
318
                else:
 
319
                    # The first conflict gets the a-range
 
320
                    yielded_a = True
 
321
                    yield ('conflict', zstart + last_base_idx, zstart +
 
322
                    base_idx,
 
323
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
 
324
            last_base_idx = base_idx + match_len
 
325
            last_b_idx = b_idx + match_len
 
326
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
 
327
            if yielded_a:
 
328
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
329
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
 
330
            else:
 
331
                # The first conflict gets the a-range
 
332
                yielded_a = True
 
333
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
334
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
 
335
        if not yielded_a:
 
336
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
 
337
 
 
338
    def reprocess_merge_regions(self, merge_regions):
 
339
        """Where there are conflict regions, remove the agreed lines.
 
340
 
 
341
        Lines where both A and B have made the same changes are
 
342
        eliminated.
 
343
        """
 
344
        for region in merge_regions:
 
345
            if region[0] != "conflict":
 
346
                yield region
 
347
                continue
 
348
            type, iz, zmatch, ia, amatch, ib, bmatch = region
 
349
            a_region = self.a[ia:amatch]
 
350
            b_region = self.b[ib:bmatch]
 
351
            matches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
352
                    None, a_region, b_region).get_matching_blocks()
 
353
            next_a = ia
 
354
            next_b = ib
 
355
            for region_ia, region_ib, region_len in matches[:-1]:
 
356
                region_ia += ia
 
357
                region_ib += ib
 
358
                reg = self.mismatch_region(next_a, region_ia, next_b,
 
359
                                           region_ib)
 
360
                if reg is not None:
 
361
                    yield reg
 
362
                yield 'same', region_ia, region_len+region_ia
 
363
                next_a = region_ia + region_len
 
364
                next_b = region_ib + region_len
 
365
            reg = self.mismatch_region(next_a, amatch, next_b, bmatch)
 
366
            if reg is not None:
 
367
                yield reg
 
368
 
 
369
    @staticmethod
 
370
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
 
371
        if next_a < region_ia or next_b < region_ib:
 
372
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
 
373
 
269
374
    def find_sync_regions(self):
270
375
        """Return a list of sync regions, where both descendents match the base.
271
376
 
272
377
        Generates a list of (base1, base2, a1, a2, b1, b2).  There is
273
378
        always a zero-length sync region at the end of all the files.
274
379
        """
275
 
        from difflib import SequenceMatcher
276
380
 
277
381
        ia = ib = 0
278
 
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
279
 
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
 
382
        amatches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
383
                None, self.base, self.a).get_matching_blocks()
 
384
        bmatches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
385
                None, self.base, self.b).get_matching_blocks()
280
386
        len_a = len(amatches)
281
387
        len_b = len(bmatches)
282
388
 
296
402
 
297
403
                # found a match of base[i[0], i[1]]; this may be less than
298
404
                # the region that matches in either one
299
 
                assert intlen <= alen
300
 
                assert intlen <= blen
301
 
                assert abase <= intbase
302
 
                assert bbase <= intbase
 
405
                # assert intlen <= alen
 
406
                # assert intlen <= blen
 
407
                # assert abase <= intbase
 
408
                # assert bbase <= intbase
303
409
 
304
410
                asub = amatch + (intbase - abase)
305
411
                bsub = bmatch + (intbase - bbase)
306
412
                aend = asub + intlen
307
413
                bend = bsub + intlen
308
414
 
309
 
                assert self.base[intbase:intend] == self.a[asub:aend], \
310
 
                       (self.base[intbase:intend], self.a[asub:aend])
311
 
 
312
 
                assert self.base[intbase:intend] == self.b[bsub:bend]
 
415
                # assert self.base[intbase:intend] == self.a[asub:aend], \
 
416
                #       (self.base[intbase:intend], self.a[asub:aend])
 
417
                # assert self.base[intbase:intend] == self.b[bsub:bend]
313
418
 
314
419
                sl.append((intbase, intend,
315
420
                           asub, aend,
316
421
                           bsub, bend))
317
 
 
318
422
            # advance whichever one ends first in the base text
319
423
            if (abase + alen) < (bbase + blen):
320
424
                ia += 1
321
425
            else:
322
426
                ib += 1
323
 
            
 
427
 
324
428
        intbase = len(self.base)
325
429
        abase = len(self.a)
326
430
        bbase = len(self.b)
328
432
 
329
433
        return sl
330
434
 
331
 
 
332
 
 
333
435
    def find_unconflicted(self):
334
436
        """Return a list of ranges in base that are not conflicted."""
335
 
        from difflib import SequenceMatcher
336
 
 
337
 
        import re
338
 
 
339
 
        # don't sync-up on lines containing only blanks or pounds
340
 
        junk_re = re.compile(r'^[ \t#]*$')
341
 
        
342
 
        am = SequenceMatcher(junk_re.match, self.base, self.a).get_matching_blocks()
343
 
        bm = SequenceMatcher(junk_re.match, self.base, self.b).get_matching_blocks()
 
437
        am = bzrlib.patiencediff.PatienceSequenceMatcher(
 
438
                None, self.base, self.a).get_matching_blocks()
 
439
        bm = bzrlib.patiencediff.PatienceSequenceMatcher(
 
440
                None, self.base, self.b).get_matching_blocks()
344
441
 
345
442
        unc = []
346
443
 
359
456
                del am[0]
360
457
            else:
361
458
                del bm[0]
362
 
                
 
459
 
363
460
        return unc
364
461
 
365
462