/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/weave.py

  • Committer: Martin Pool
  • Date: 2005-08-04 22:04:40 UTC
  • Revision ID: mbp@sourcefrog.net-20050804220440-99562df8151d1ac5
- add pending merge from aaron

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
#! /usr/bin/python
2
2
 
3
3
# Copyright (C) 2005 Canonical Ltd
4
 
#
 
4
 
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
#
 
9
 
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
#
 
14
 
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
21
21
 
22
22
"""Weave - storage of related text file versions"""
23
23
 
 
24
# before intset (r923) 2000 versions in 41.5s
 
25
# with intset (r926) 2000 versions in 93s !!!
 
26
# better to just use plain sets.
 
27
 
 
28
# making _extract build and return a list, rather than being a generator
 
29
# takes 37.94s
 
30
 
 
31
# with python -O, r923 does 2000 versions in 36.87s
 
32
 
 
33
# with optimizations to avoid mutating lists - 35.75!  I guess copying
 
34
# all the elements every time costs more than the small manipulations.
 
35
# a surprisingly small change.
 
36
 
 
37
# r931, which avoids using a generator for extract, does 36.98s
 
38
 
 
39
# with memoized inclusions, takes 41.49s; not very good
 
40
 
 
41
# with slots, takes 37.35s; without takes 39.16, a bit surprising
 
42
 
 
43
# with the delta calculation mixed in with the add method, rather than
 
44
# separated, takes 36.78s
 
45
 
 
46
# with delta folded in and mutation of the list, 36.13s
 
47
 
 
48
# with all this and simplification of add code, 33s 
 
49
 
 
50
 
 
51
# TODO: Perhaps have copy method for Weave instances?
24
52
 
25
53
# XXX: If we do weaves this way, will a merge still behave the same
26
54
# way if it's done in a different order?  That's a pretty desirable
27
55
# property.
28
56
 
29
57
# TODO: Nothing here so far assumes the lines are really \n newlines,
30
 
# rather than being split up in some other way.  We could accommodate
 
58
# rather than being split up in some other way.  We could accomodate
31
59
# binaries, perhaps by naively splitting on \n or perhaps using
32
60
# something like a rolling checksum.
33
61
 
 
62
# TODO: Track version names as well as indexes. 
 
63
 
34
64
# TODO: End marker for each version so we can stop reading?
35
65
 
36
66
# TODO: Check that no insertion occurs inside a deletion that was
43
73
 
44
74
# TODO: Parallel-extract that passes back each line along with a
45
75
# description of which revisions include it.  Nice for checking all
46
 
# shas or calculating stats in parallel.
47
 
 
48
 
# TODO: Using a single _extract routine and then processing the output
49
 
# is probably inefficient.  It's simple enough that we can afford to
50
 
# have slight specializations for different ways its used: annotate,
51
 
# basis for add, get, etc.
52
 
 
53
 
# TODO: Probably the API should work only in names to hide the integer
54
 
# indexes from the user.
55
 
 
56
 
# TODO: Is there any potential performance win by having an add()
57
 
# variant that is passed a pre-cooked version of the single basis
58
 
# version?
59
 
 
60
 
# TODO: Reweave can possibly be made faster by remembering diffs
61
 
# where the basis and destination are unchanged.
62
 
 
63
 
# FIXME: Sometimes we will be given a parents list for a revision
64
 
# that includes some redundant parents (i.e. already a parent of
65
 
# something in the list.)  We should eliminate them.  This can
66
 
# be done fairly efficiently because the sequence numbers constrain
67
 
# the possible relationships.
68
 
 
69
 
# FIXME: the conflict markers should be *7* characters
70
 
 
71
 
from copy import copy
72
 
from cStringIO import StringIO
73
 
import os
74
 
import time
75
 
import warnings
76
 
 
77
 
from bzrlib.lazy_import import lazy_import
78
 
lazy_import(globals(), """
79
 
from bzrlib import tsort
80
 
""")
81
 
from bzrlib import (
82
 
    errors,
83
 
    osutils,
84
 
    progress,
85
 
    )
86
 
from bzrlib.errors import (WeaveError, WeaveFormatError, WeaveParentMismatch,
87
 
        RevisionAlreadyPresent,
88
 
        RevisionNotPresent,
89
 
        UnavailableRepresentation,
90
 
        WeaveRevisionAlreadyPresent,
91
 
        WeaveRevisionNotPresent,
92
 
        )
93
 
from bzrlib.osutils import dirname, sha, sha_strings, split_lines
94
 
import bzrlib.patiencediff
95
 
from bzrlib.revision import NULL_REVISION
96
 
from bzrlib.symbol_versioning import *
97
 
from bzrlib.trace import mutter
98
 
from bzrlib.versionedfile import (
99
 
    AbsentContentFactory,
100
 
    adapter_registry,
101
 
    ContentFactory,
102
 
    VersionedFile,
103
 
    )
104
 
from bzrlib.weavefile import _read_weave_v5, write_weave_v5
105
 
 
106
 
 
107
 
class WeaveContentFactory(ContentFactory):
108
 
    """Content factory for streaming from weaves.
109
 
 
110
 
    :seealso ContentFactory:
111
 
    """
112
 
 
113
 
    def __init__(self, version, weave):
114
 
        """Create a WeaveContentFactory for version from weave."""
115
 
        ContentFactory.__init__(self)
116
 
        self.sha1 = weave.get_sha1s([version])[version]
117
 
        self.key = (version,)
118
 
        parents = weave.get_parent_map([version])[version]
119
 
        self.parents = tuple((parent,) for parent in parents)
120
 
        self.storage_kind = 'fulltext'
121
 
        self._weave = weave
122
 
 
123
 
    def get_bytes_as(self, storage_kind):
124
 
        if storage_kind == 'fulltext':
125
 
            return self._weave.get_text(self.key[-1])
126
 
        elif storage_kind == 'chunked':
127
 
            return self._weave.get_lines(self.key[-1])
128
 
        else:
129
 
            raise UnavailableRepresentation(self.key, storage_kind, 'fulltext')
130
 
 
131
 
 
132
 
class Weave(VersionedFile):
 
76
# shas in parallel.
 
77
 
 
78
 
 
79
 
 
80
 
 
81
class WeaveError(Exception):
 
82
    """Exception in processing weave"""
 
83
 
 
84
 
 
85
class WeaveFormatError(WeaveError):
 
86
    """Weave invariant violated"""
 
87
    
 
88
 
 
89
class Weave(object):
133
90
    """weave - versioned text file storage.
134
 
 
 
91
    
135
92
    A Weave manages versions of line-based text files, keeping track
136
93
    of the originating version for each line.
137
94
 
161
118
    The instruction can be '{' or '}' for an insertion block, and '['
162
119
    and ']' for a deletion block respectively.  The version is the
163
120
    integer version index.  There is no replace operator, only deletes
164
 
    and inserts.  For '}', the end of an insertion, there is no
165
 
    version parameter because it always closes the most recently
166
 
    opened insertion.
 
121
    and inserts.
167
122
 
168
123
    Constraints/notes:
169
124
 
183
138
 
184
139
    * It doesn't seem very useful to have an active insertion
185
140
      inside an inactive insertion, but it might happen.
186
 
 
 
141
      
187
142
    * Therefore, all instructions are always"considered"; that
188
143
      is passed onto and off the stack.  An outer inactive block
189
144
      doesn't disable an inner block.
205
160
        each version; the parent's parents are implied.
206
161
 
207
162
    _sha1s
208
 
        List of hex SHA-1 of each version.
209
 
 
210
 
    _names
211
 
        List of symbolic names for each version.  Each should be unique.
212
 
 
213
 
    _name_map
214
 
        For each name, the version number.
215
 
 
216
 
    _weave_name
217
 
        Descriptive name of this weave; typically the filename if known.
218
 
        Set by read_weave.
 
163
        List of hex SHA-1 of each version, or None if not recorded.
219
164
    """
220
165
 
221
 
    __slots__ = ['_weave', '_parents', '_sha1s', '_names', '_name_map',
222
 
                 '_weave_name', '_matcher', '_allow_reserved']
223
 
 
224
 
    def __init__(self, weave_name=None, access_mode='w', matcher=None,
225
 
                 get_scope=None, allow_reserved=False):
226
 
        """Create a weave.
227
 
 
228
 
        :param get_scope: A callable that returns an opaque object to be used
229
 
            for detecting when this weave goes out of scope (should stop
230
 
            answering requests or allowing mutation).
231
 
        """
232
 
        super(Weave, self).__init__()
 
166
    __slots__ = ['_weave', '_parents', '_sha1s']
 
167
    
 
168
    def __init__(self):
233
169
        self._weave = []
234
170
        self._parents = []
235
171
        self._sha1s = []
236
 
        self._names = []
237
 
        self._name_map = {}
238
 
        self._weave_name = weave_name
239
 
        if matcher is None:
240
 
            self._matcher = bzrlib.patiencediff.PatienceSequenceMatcher
241
 
        else:
242
 
            self._matcher = matcher
243
 
        if get_scope is None:
244
 
            get_scope = lambda:None
245
 
        self._get_scope = get_scope
246
 
        self._scope = get_scope()
247
 
        self._access_mode = access_mode
248
 
        self._allow_reserved = allow_reserved
249
 
 
250
 
    def __repr__(self):
251
 
        return "Weave(%r)" % self._weave_name
252
 
 
253
 
    def _check_write_ok(self):
254
 
        """Is the versioned file marked as 'finished' ? Raise if it is."""
255
 
        if self._get_scope() != self._scope:
256
 
            raise errors.OutSideTransaction()
257
 
        if self._access_mode != 'w':
258
 
            raise errors.ReadOnlyObjectDirtiedError(self)
259
 
 
260
 
    def copy(self):
261
 
        """Return a deep copy of self.
262
 
 
263
 
        The copy can be modified without affecting the original weave."""
264
 
        other = Weave()
265
 
        other._weave = self._weave[:]
266
 
        other._parents = self._parents[:]
267
 
        other._sha1s = self._sha1s[:]
268
 
        other._names = self._names[:]
269
 
        other._name_map = self._name_map.copy()
270
 
        other._weave_name = self._weave_name
271
 
        return other
 
172
 
272
173
 
273
174
    def __eq__(self, other):
274
175
        if not isinstance(other, Weave):
275
176
            return False
276
177
        return self._parents == other._parents \
277
 
               and self._weave == other._weave \
278
 
               and self._sha1s == other._sha1s
 
178
               and self._weave == other._weave
 
179
    
279
180
 
280
181
    def __ne__(self, other):
281
182
        return not self.__eq__(other)
282
183
 
283
 
    def _idx_to_name(self, version):
284
 
        return self._names[version]
285
 
 
286
 
    def _lookup(self, name):
287
 
        """Convert symbolic version name to index."""
288
 
        if not self._allow_reserved:
289
 
            self.check_not_reserved_id(name)
290
 
        try:
291
 
            return self._name_map[name]
292
 
        except KeyError:
293
 
            raise RevisionNotPresent(name, self._weave_name)
294
 
 
295
 
    def versions(self):
296
 
        """See VersionedFile.versions."""
297
 
        return self._names[:]
298
 
 
299
 
    def has_version(self, version_id):
300
 
        """See VersionedFile.has_version."""
301
 
        return (version_id in self._name_map)
302
 
 
303
 
    __contains__ = has_version
304
 
 
305
 
    def get_record_stream(self, versions, ordering, include_delta_closure):
306
 
        """Get a stream of records for versions.
307
 
 
308
 
        :param versions: The versions to include. Each version is a tuple
309
 
            (version,).
310
 
        :param ordering: Either 'unordered' or 'topological'. A topologically
311
 
            sorted stream has compression parents strictly before their
312
 
            children.
313
 
        :param include_delta_closure: If True then the closure across any
314
 
            compression parents will be included (in the opaque data).
315
 
        :return: An iterator of ContentFactory objects, each of which is only
316
 
            valid until the iterator is advanced.
317
 
        """
318
 
        versions = [version[-1] for version in versions]
319
 
        if ordering == 'topological':
320
 
            parents = self.get_parent_map(versions)
321
 
            new_versions = tsort.topo_sort(parents)
322
 
            new_versions.extend(set(versions).difference(set(parents)))
323
 
            versions = new_versions
324
 
        for version in versions:
325
 
            if version in self:
326
 
                yield WeaveContentFactory(version, self)
327
 
            else:
328
 
                yield AbsentContentFactory((version,))
329
 
 
330
 
    def get_parent_map(self, version_ids):
331
 
        """See VersionedFile.get_parent_map."""
332
 
        result = {}
333
 
        for version_id in version_ids:
334
 
            if version_id == NULL_REVISION:
335
 
                parents = ()
336
 
            else:
337
 
                try:
338
 
                    parents = tuple(
339
 
                        map(self._idx_to_name,
340
 
                            self._parents[self._lookup(version_id)]))
341
 
                except RevisionNotPresent:
342
 
                    continue
343
 
            result[version_id] = parents
344
 
        return result
345
 
 
346
 
    def get_parents_with_ghosts(self, version_id):
347
 
        raise NotImplementedError(self.get_parents_with_ghosts)
348
 
 
349
 
    def insert_record_stream(self, stream):
350
 
        """Insert a record stream into this versioned file.
351
 
 
352
 
        :param stream: A stream of records to insert.
353
 
        :return: None
354
 
        :seealso VersionedFile.get_record_stream:
355
 
        """
356
 
        adapters = {}
357
 
        for record in stream:
358
 
            # Raise an error when a record is missing.
359
 
            if record.storage_kind == 'absent':
360
 
                raise RevisionNotPresent([record.key[0]], self)
361
 
            # adapt to non-tuple interface
362
 
            parents = [parent[0] for parent in record.parents]
363
 
            if (record.storage_kind == 'fulltext'
364
 
                or record.storage_kind == 'chunked'):
365
 
                self.add_lines(record.key[0], parents,
366
 
                    osutils.chunks_to_lines(record.get_bytes_as('chunked')))
367
 
            else:
368
 
                adapter_key = record.storage_kind, 'fulltext'
369
 
                try:
370
 
                    adapter = adapters[adapter_key]
371
 
                except KeyError:
372
 
                    adapter_factory = adapter_registry.get(adapter_key)
373
 
                    adapter = adapter_factory(self)
374
 
                    adapters[adapter_key] = adapter
375
 
                lines = split_lines(adapter.get_bytes(record))
376
 
                try:
377
 
                    self.add_lines(record.key[0], parents, lines)
378
 
                except RevisionAlreadyPresent:
379
 
                    pass
380
 
 
381
 
    def _check_repeated_add(self, name, parents, text, sha1):
382
 
        """Check that a duplicated add is OK.
383
 
 
384
 
        If it is, return the (old) index; otherwise raise an exception.
385
 
        """
386
 
        idx = self._lookup(name)
387
 
        if sorted(self._parents[idx]) != sorted(parents) \
388
 
            or sha1 != self._sha1s[idx]:
389
 
            raise RevisionAlreadyPresent(name, self._weave_name)
390
 
        return idx
391
 
 
392
 
    def _add_lines(self, version_id, parents, lines, parent_texts,
393
 
       left_matching_blocks, nostore_sha, random_id, check_content):
394
 
        """See VersionedFile.add_lines."""
395
 
        idx = self._add(version_id, lines, map(self._lookup, parents),
396
 
            nostore_sha=nostore_sha)
397
 
        return sha_strings(lines), sum(map(len, lines)), idx
398
 
 
399
 
    def _add(self, version_id, lines, parents, sha1=None, nostore_sha=None):
 
184
        
 
185
    def add(self, parents, text):
400
186
        """Add a single text on top of the weave.
401
 
 
 
187
  
402
188
        Returns the index number of the newly added version.
403
189
 
404
 
        version_id
405
 
            Symbolic name for this version.
406
 
            (Typically the revision-id of the revision that added it.)
407
 
 
408
190
        parents
409
191
            List or set of direct parent version numbers.
410
 
 
411
 
        lines
412
 
            Sequence of lines to be added in the new version.
413
 
 
414
 
        :param nostore_sha: See VersionedFile.add_lines.
415
 
        """
416
 
        self._check_lines_not_unicode(lines)
417
 
        self._check_lines_are_lines(lines)
418
 
        if not sha1:
419
 
            sha1 = sha_strings(lines)
420
 
        if sha1 == nostore_sha:
421
 
            raise errors.ExistingContent
422
 
        if version_id in self._name_map:
423
 
            return self._check_repeated_add(version_id, parents, lines, sha1)
 
192
            
 
193
        text
 
194
            Sequence of lines to be added in the new version."""
424
195
 
425
196
        self._check_versions(parents)
426
 
        ## self._check_lines(lines)
 
197
        ## self._check_lines(text)
427
198
        new_version = len(self._parents)
428
199
 
429
 
        # if we abort after here the (in-memory) weave will be corrupt because only
430
 
        # some fields are updated
431
 
        # XXX: FIXME implement a succeed-or-fail of the rest of this routine.
432
 
        #      - Robert Collins 20060226
433
 
        self._parents.append(parents[:])
 
200
        import sha
 
201
        s = sha.new()
 
202
        map(s.update, text)
 
203
        sha1 = s.hexdigest()
 
204
        del s
 
205
 
 
206
        # if we abort after here the weave will be corrupt
 
207
        self._parents.append(frozenset(parents))
434
208
        self._sha1s.append(sha1)
435
 
        self._names.append(version_id)
436
 
        self._name_map[version_id] = new_version
437
 
 
438
 
 
 
209
 
 
210
            
439
211
        if not parents:
440
212
            # special case; adding with no parents revision; can do
441
213
            # this more quickly by just appending unconditionally.
442
214
            # even more specially, if we're adding an empty text we
443
215
            # need do nothing at all.
444
 
            if lines:
 
216
            if text:
445
217
                self._weave.append(('{', new_version))
446
 
                self._weave.extend(lines)
447
 
                self._weave.append(('}', None))
 
218
                self._weave.extend(text)
 
219
                self._weave.append(('}', new_version))
 
220
        
448
221
            return new_version
449
222
 
450
223
        if len(parents) == 1:
452
225
            if sha1 == self._sha1s[pv]:
453
226
                # special case: same as the single parent
454
227
                return new_version
455
 
 
456
 
 
457
 
        ancestors = self._inclusions(parents)
 
228
            
 
229
 
 
230
        ancestors = self.inclusions(parents)
458
231
 
459
232
        l = self._weave
460
233
 
465
238
            basis_lineno.append(lineno)
466
239
            basis_lines.append(line)
467
240
 
468
 
        # another small special case: a merge, producing the same text
469
 
        # as auto-merge
470
 
        if lines == basis_lines:
471
 
            return new_version
 
241
        # another small special case: a merge, producing the same text as auto-merge
 
242
        if text == basis_lines:
 
243
            return new_version            
472
244
 
473
 
        # add a sentinel, because we can also match against the final line
 
245
        # add a sentinal, because we can also match against the final line
474
246
        basis_lineno.append(len(self._weave))
475
247
 
476
248
        # XXX: which line of the weave should we really consider
480
252
        #print 'basis_lines:', basis_lines
481
253
        #print 'new_lines:  ', lines
482
254
 
483
 
        s = self._matcher(None, basis_lines, lines)
 
255
        from difflib import SequenceMatcher
 
256
        s = SequenceMatcher(None, basis_lines, text)
484
257
 
485
258
        # offset gives the number of lines that have been inserted
486
259
        # into the weave up to the current point; if the original edit instruction
493
266
            #print 'raw match', tag, i1, i2, j1, j2
494
267
            if tag == 'equal':
495
268
                continue
 
269
 
496
270
            i1 = basis_lineno[i1]
497
271
            i2 = basis_lineno[i2]
 
272
 
 
273
            assert 0 <= j1 <= j2 <= len(text)
 
274
 
 
275
            #print tag, i1, i2, j1, j2
 
276
 
498
277
            # the deletion and insertion are handled separately.
499
278
            # first delete the region.
500
279
            if i1 != i2:
507
286
                # i2; we want to insert after this region to make sure
508
287
                # we don't destroy ourselves
509
288
                i = i2 + offset
510
 
                self._weave[i:i] = ([('{', new_version)]
511
 
                                    + lines[j1:j2]
512
 
                                    + [('}', None)])
 
289
                self._weave[i:i] = ([('{', new_version)] 
 
290
                                + text[j1:j2] 
 
291
                                + [('}', new_version)])
513
292
                offset += 2 + (j2 - j1)
 
293
 
514
294
        return new_version
515
295
 
516
 
    def _inclusions(self, versions):
 
296
 
 
297
    def inclusions(self, versions):
517
298
        """Return set of all ancestors of given version(s)."""
518
 
        if not len(versions):
 
299
        i = set(versions)
 
300
        v = max(versions)
 
301
        try:
 
302
            while v >= 0:
 
303
                if v in i:
 
304
                    # include all its parents
 
305
                    i.update(self._parents[v])
 
306
                v -= 1
 
307
            return i
 
308
        except IndexError:
 
309
            raise ValueError("version %d not present in weave" % v)
 
310
 
 
311
 
 
312
    def minimal_parents(self, version):
 
313
        """Find the minimal set of parents for the version."""
 
314
        included = self._parents[version]
 
315
        if not included:
519
316
            return []
520
 
        i = set(versions)
521
 
        for v in xrange(max(versions), 0, -1):
522
 
            if v in i:
523
 
                # include all its parents
524
 
                i.update(self._parents[v])
525
 
        return i
526
 
        ## except IndexError:
527
 
        ##     raise ValueError("version %d not present in weave" % v)
528
 
 
529
 
    def get_ancestry(self, version_ids, topo_sorted=True):
530
 
        """See VersionedFile.get_ancestry."""
531
 
        if isinstance(version_ids, basestring):
532
 
            version_ids = [version_ids]
533
 
        i = self._inclusions([self._lookup(v) for v in version_ids])
534
 
        return [self._idx_to_name(v) for v in i]
 
317
        
 
318
        li = list(included)
 
319
        li.sort(reverse=True)
 
320
 
 
321
        mininc = []
 
322
        gotit = set()
 
323
 
 
324
        for pv in li:
 
325
            if pv not in gotit:
 
326
                mininc.append(pv)
 
327
                gotit.update(self.inclusions(pv))
 
328
 
 
329
        assert mininc[0] >= 0
 
330
        assert mininc[-1] < version
 
331
        return mininc
 
332
 
 
333
 
535
334
 
536
335
    def _check_lines(self, text):
537
336
        if not isinstance(text, list):
541
340
            if not isinstance(l, basestring):
542
341
                raise ValueError("text line should be a string or unicode, not %s"
543
342
                                 % type(l))
544
 
 
 
343
        
545
344
 
546
345
 
547
346
    def _check_versions(self, indexes):
552
351
            except IndexError:
553
352
                raise IndexError("invalid version number %r" % i)
554
353
 
555
 
    def _compatible_parents(self, my_parents, other_parents):
556
 
        """During join check that other_parents are joinable with my_parents.
557
 
 
558
 
        Joinable is defined as 'is a subset of' - supersets may require
559
 
        regeneration of diffs, but subsets do not.
560
 
        """
561
 
        return len(other_parents.difference(my_parents)) == 0
562
 
 
563
 
    def annotate(self, version_id):
564
 
        """Return a list of (version-id, line) tuples for version_id.
 
354
    
 
355
    def annotate(self, index):
 
356
        return list(self.annotate_iter(index))
 
357
 
 
358
 
 
359
    def annotate_iter(self, version):
 
360
        """Yield list of (index-id, line) pairs for the specified version.
565
361
 
566
362
        The index indicates when the line originated in the weave."""
567
 
        incls = [self._lookup(version_id)]
568
 
        return [(self._idx_to_name(origin), text) for origin, lineno, text in
569
 
            self._extract(incls)]
570
 
 
571
 
    def iter_lines_added_or_present_in_versions(self, version_ids=None,
572
 
                                                pb=None):
573
 
        """See VersionedFile.iter_lines_added_or_present_in_versions()."""
574
 
        if version_ids is None:
575
 
            version_ids = self.versions()
576
 
        version_ids = set(version_ids)
577
 
        for lineno, inserted, deletes, line in self._walk_internal(version_ids):
578
 
            # if inserted not in version_ids then it was inserted before the
579
 
            # versions we care about, but because weaves cannot represent ghosts
580
 
            # properly, we do not filter down to that
581
 
            # if inserted not in version_ids: continue
582
 
            if line[-1] != '\n':
583
 
                yield line + '\n', inserted
584
 
            else:
585
 
                yield line, inserted
586
 
 
587
 
    def _walk_internal(self, version_ids=None):
588
 
        """Helper method for weave actions."""
589
 
 
 
363
        for origin, lineno, text in self._extract([version]):
 
364
            yield origin, text
 
365
 
 
366
 
 
367
    def _walk(self):
 
368
        """Walk the weave.
 
369
 
 
370
        Yields sequence of
 
371
        (lineno, insert, deletes, text)
 
372
        for each literal line.
 
373
        """
 
374
        
590
375
        istack = []
591
376
        dset = set()
592
377
 
593
378
        lineno = 0         # line of weave, 0-based
594
379
 
595
380
        for l in self._weave:
596
 
            if l.__class__ == tuple:
 
381
            if isinstance(l, tuple):
597
382
                c, v = l
598
383
                isactive = None
599
384
                if c == '{':
600
 
                    istack.append(self._names[v])
 
385
                    istack.append(v)
601
386
                elif c == '}':
602
 
                    istack.pop()
 
387
                    oldv = istack.pop()
603
388
                elif c == '[':
604
 
                    dset.add(self._names[v])
 
389
                    assert v not in dset
 
390
                    dset.add(v)
605
391
                elif c == ']':
606
 
                    dset.remove(self._names[v])
607
 
                else:
608
 
                    raise WeaveFormatError('unexpected instruction %r' % v)
609
 
            else:
610
 
                yield lineno, istack[-1], frozenset(dset), l
 
392
                    dset.remove(v)
 
393
                else:
 
394
                    raise WeaveFormatError('unexpected instruction %r'
 
395
                                           % v)
 
396
            else:
 
397
                assert isinstance(l, basestring)
 
398
                assert istack
 
399
                yield lineno, istack[-1], dset, l
 
400
            lineno += 1
 
401
 
 
402
 
 
403
 
 
404
    def _extract(self, versions):
 
405
        """Yield annotation of lines in included set.
 
406
 
 
407
        Yields a sequence of tuples (origin, lineno, text), where
 
408
        origin is the origin version, lineno the index in the weave,
 
409
        and text the text of the line.
 
410
 
 
411
        The set typically but not necessarily corresponds to a version.
 
412
        """
 
413
        included = self.inclusions(versions)
 
414
 
 
415
        istack = []
 
416
        dset = set()
 
417
 
 
418
        lineno = 0         # line of weave, 0-based
 
419
 
 
420
        isactive = None
 
421
 
 
422
        result = []
 
423
 
 
424
        WFE = WeaveFormatError
 
425
 
 
426
        for l in self._weave:
 
427
            if isinstance(l, tuple):
 
428
                c, v = l
 
429
                isactive = None
 
430
                if c == '{':
 
431
                    assert v not in istack
 
432
                    istack.append(v)
 
433
                elif c == '}':
 
434
                    oldv = istack.pop()
 
435
                    assert oldv == v
 
436
                elif c == '[':
 
437
                    if v in included:
 
438
                        assert v not in dset
 
439
                        dset.add(v)
 
440
                else:
 
441
                    assert c == ']'
 
442
                    if v in included:
 
443
                        assert v in dset
 
444
                        dset.remove(v)
 
445
            else:
 
446
                assert isinstance(l, basestring)
 
447
                if isactive is None:
 
448
                    isactive = (not dset) and istack and (istack[-1] in included)
 
449
                if isactive:
 
450
                    result.append((istack[-1], lineno, l))
611
451
            lineno += 1
612
452
 
613
453
        if istack:
614
 
            raise WeaveFormatError("unclosed insertion blocks "
615
 
                    "at end of weave: %s" % istack)
 
454
            raise WFE("unclosed insertion blocks at end of weave",
 
455
                                   istack)
616
456
        if dset:
617
 
            raise WeaveFormatError("unclosed deletion blocks at end of weave: %s"
618
 
                                   % dset)
619
 
 
 
457
            raise WFE("unclosed deletion blocks at end of weave",
 
458
                                   dset)
 
459
 
 
460
        return result
 
461
    
 
462
 
 
463
 
 
464
    def get_iter(self, version):
 
465
        """Yield lines for the specified version."""
 
466
        for origin, lineno, line in self._extract([version]):
 
467
            yield line
 
468
 
 
469
 
 
470
    def get(self, index):
 
471
        return list(self.get_iter(index))
 
472
 
 
473
 
 
474
    def mash_iter(self, included):
 
475
        """Return composed version of multiple included versions."""
 
476
        for origin, lineno, text in self._extract(included):
 
477
            yield text
 
478
 
 
479
 
 
480
    def dump(self, to_file):
 
481
        from pprint import pprint
 
482
        print >>to_file, "Weave._weave = ",
 
483
        pprint(self._weave, to_file)
 
484
        print >>to_file, "Weave._parents = ",
 
485
        pprint(self._parents, to_file)
 
486
 
 
487
 
 
488
 
 
489
    def numversions(self):
 
490
        l = len(self._parents)
 
491
        assert l == len(self._sha1s)
 
492
        return l
 
493
 
 
494
 
 
495
    def __len__(self):
 
496
        return self.numversions()
 
497
 
 
498
 
 
499
    def check(self, progress_bar=None):
 
500
        # check no circular inclusions
 
501
        for version in range(self.numversions()):
 
502
            inclusions = list(self._parents[version])
 
503
            if inclusions:
 
504
                inclusions.sort()
 
505
                if inclusions[-1] >= version:
 
506
                    raise WeaveFormatError("invalid included version %d for index %d"
 
507
                                           % (inclusions[-1], version))
 
508
 
 
509
        # try extracting all versions; this is a bit slow and parallel
 
510
        # extraction could be used
 
511
        import sha
 
512
        nv = self.numversions()
 
513
        for version in range(nv):
 
514
            if progress_bar:
 
515
                progress_bar.update('checking text', version, nv)
 
516
            s = sha.new()
 
517
            for l in self.get_iter(version):
 
518
                s.update(l)
 
519
            hd = s.hexdigest()
 
520
            expected = self._sha1s[version]
 
521
            if hd != expected:
 
522
                raise WeaveError("mismatched sha1 for version %d; "
 
523
                                 "got %s, expected %s"
 
524
                                 % (version, hd, expected))
 
525
 
 
526
        # TODO: check insertions are properly nested, that there are
 
527
        # no lines outside of insertion blocks, that deletions are
 
528
        # properly paired, etc.
 
529
 
 
530
 
 
531
 
 
532
    def merge(self, merge_versions):
 
533
        """Automerge and mark conflicts between versions.
 
534
 
 
535
        This returns a sequence, each entry describing alternatives
 
536
        for a chunk of the file.  Each of the alternatives is given as
 
537
        a list of lines.
 
538
 
 
539
        If there is a chunk of the file where there's no diagreement,
 
540
        only one alternative is given.
 
541
        """
 
542
 
 
543
        # approach: find the included versions common to all the
 
544
        # merged versions
 
545
        raise NotImplementedError()
 
546
 
 
547
 
 
548
 
 
549
    def _delta(self, included, lines):
 
550
        """Return changes from basis to new revision.
 
551
 
 
552
        The old text for comparison is the union of included revisions.
 
553
 
 
554
        This is used in inserting a new text.
 
555
 
 
556
        Delta is returned as a sequence of
 
557
        (weave1, weave2, newlines).
 
558
 
 
559
        This indicates that weave1:weave2 of the old weave should be
 
560
        replaced by the sequence of lines in newlines.  Note that
 
561
        these line numbers are positions in the total weave and don't
 
562
        correspond to the lines in any extracted version, or even the
 
563
        extracted union of included versions.
 
564
 
 
565
        If line1=line2, this is a pure insert; if newlines=[] this is a
 
566
        pure delete.  (Similar to difflib.)
 
567
        """
 
568
 
 
569
 
 
570
            
620
571
    def plan_merge(self, ver_a, ver_b):
621
572
        """Return pseudo-annotation indicating how the two versions merge.
622
573
 
625
576
 
626
577
        Weave lines present in none of them are skipped entirely.
627
578
        """
628
 
        inc_a = set(self.get_ancestry([ver_a]))
629
 
        inc_b = set(self.get_ancestry([ver_b]))
 
579
        inc_a = self.inclusions([ver_a])
 
580
        inc_b = self.inclusions([ver_b])
630
581
        inc_c = inc_a & inc_b
631
582
 
632
 
        for lineno, insert, deleteset, line in self._walk_internal([ver_a, ver_b]):
 
583
        for lineno, insert, deleteset, line in self._walk():
633
584
            if deleteset & inc_c:
634
585
                # killed in parent; can't be in either a or b
635
586
                # not relevant to our work
661
612
                # not in either revision
662
613
                yield 'irrelevant', line
663
614
 
664
 
    def _extract(self, versions):
665
 
        """Yield annotation of lines in included set.
666
 
 
667
 
        Yields a sequence of tuples (origin, lineno, text), where
668
 
        origin is the origin version, lineno the index in the weave,
669
 
        and text the text of the line.
670
 
 
671
 
        The set typically but not necessarily corresponds to a version.
672
 
        """
673
 
        for i in versions:
674
 
            if not isinstance(i, int):
675
 
                raise ValueError(i)
676
 
 
677
 
        included = self._inclusions(versions)
678
 
 
679
 
        istack = []
680
 
        iset = set()
681
 
        dset = set()
682
 
 
683
 
        lineno = 0         # line of weave, 0-based
684
 
 
685
 
        isactive = None
686
 
 
687
 
        result = []
688
 
 
689
 
        WFE = WeaveFormatError
690
 
 
691
 
        # wow.
692
 
        #  449       0   4474.6820   2356.5590   bzrlib.weave:556(_extract)
693
 
        #  +285282   0   1676.8040   1676.8040   +<isinstance>
694
 
        # 1.6 seconds in 'isinstance'.
695
 
        # changing the first isinstance:
696
 
        #  449       0   2814.2660   1577.1760   bzrlib.weave:556(_extract)
697
 
        #  +140414   0    762.8050    762.8050   +<isinstance>
698
 
        # note that the inline time actually dropped (less function calls)
699
 
        # and total processing time was halved.
700
 
        # we're still spending ~1/4 of the method in isinstance though.
701
 
        # so lets hard code the acceptable string classes we expect:
702
 
        #  449       0   1202.9420    786.2930   bzrlib.weave:556(_extract)
703
 
        # +71352     0    377.5560    377.5560   +<method 'append' of 'list'
704
 
        #                                          objects>
705
 
        # yay, down to ~1/4 the initial extract time, and our inline time
706
 
        # has shrunk again, with isinstance no longer dominating.
707
 
        # tweaking the stack inclusion test to use a set gives:
708
 
        #  449       0   1122.8030    713.0080   bzrlib.weave:556(_extract)
709
 
        # +71352     0    354.9980    354.9980   +<method 'append' of 'list'
710
 
        #                                          objects>
711
 
        # - a 5% win, or possibly just noise. However with large istacks that
712
 
        # 'in' test could dominate, so I'm leaving this change in place -
713
 
        # when its fast enough to consider profiling big datasets we can review.
714
 
 
715
 
 
716
 
 
717
 
 
718
 
        for l in self._weave:
719
 
            if l.__class__ == tuple:
720
 
                c, v = l
721
 
                isactive = None
722
 
                if c == '{':
723
 
                    istack.append(v)
724
 
                    iset.add(v)
725
 
                elif c == '}':
726
 
                    iset.remove(istack.pop())
727
 
                elif c == '[':
728
 
                    if v in included:
729
 
                        dset.add(v)
730
 
                elif c == ']':
731
 
                    if v in included:
732
 
                        dset.remove(v)
 
615
        yield 'unchanged', ''           # terminator
 
616
 
 
617
 
 
618
 
 
619
    def weave_merge(self, plan):
 
620
        lines_a = []
 
621
        lines_b = []
 
622
        ch_a = ch_b = False
 
623
 
 
624
        for state, line in plan:
 
625
            if state == 'unchanged' or state == 'killed-both':
 
626
                # resync and flush queued conflicts changes if any
 
627
                if not lines_a and not lines_b:
 
628
                    pass
 
629
                elif ch_a and not ch_b:
 
630
                    # one-sided change:                    
 
631
                    for l in lines_a: yield l
 
632
                elif ch_b and not ch_a:
 
633
                    for l in lines_b: yield l
 
634
                elif lines_a == lines_b:
 
635
                    for l in lines_a: yield l
733
636
                else:
734
 
                    raise AssertionError()
735
 
            else:
736
 
                if isactive is None:
737
 
                    isactive = (not dset) and istack and (istack[-1] in included)
738
 
                if isactive:
739
 
                    result.append((istack[-1], lineno, l))
740
 
            lineno += 1
741
 
        if istack:
742
 
            raise WeaveFormatError("unclosed insertion blocks "
743
 
                    "at end of weave: %s" % istack)
744
 
        if dset:
745
 
            raise WeaveFormatError("unclosed deletion blocks at end of weave: %s"
746
 
                                   % dset)
747
 
        return result
748
 
 
749
 
    def _maybe_lookup(self, name_or_index):
750
 
        """Convert possible symbolic name to index, or pass through indexes.
751
 
 
752
 
        NOT FOR PUBLIC USE.
753
 
        """
754
 
        if isinstance(name_or_index, (int, long)):
755
 
            return name_or_index
756
 
        else:
757
 
            return self._lookup(name_or_index)
758
 
 
759
 
    def get_lines(self, version_id):
760
 
        """See VersionedFile.get_lines()."""
761
 
        int_index = self._maybe_lookup(version_id)
762
 
        result = [line for (origin, lineno, line) in self._extract([int_index])]
763
 
        expected_sha1 = self._sha1s[int_index]
764
 
        measured_sha1 = sha_strings(result)
765
 
        if measured_sha1 != expected_sha1:
766
 
            raise errors.WeaveInvalidChecksum(
767
 
                    'file %s, revision %s, expected: %s, measured %s'
768
 
                    % (self._weave_name, version_id,
769
 
                       expected_sha1, measured_sha1))
770
 
        return result
771
 
 
772
 
    def get_sha1s(self, version_ids):
773
 
        """See VersionedFile.get_sha1s()."""
774
 
        result = {}
775
 
        for v in version_ids:
776
 
            result[v] = self._sha1s[self._lookup(v)]
777
 
        return result
778
 
 
779
 
    def num_versions(self):
780
 
        """How many versions are in this weave?"""
781
 
        l = len(self._parents)
782
 
        return l
783
 
 
784
 
    __len__ = num_versions
785
 
 
786
 
    def check(self, progress_bar=None):
787
 
        # TODO evaluate performance hit of using string sets in this routine.
788
 
        # TODO: check no circular inclusions
789
 
        # TODO: create a nested progress bar
790
 
        for version in range(self.num_versions()):
791
 
            inclusions = list(self._parents[version])
792
 
            if inclusions:
793
 
                inclusions.sort()
794
 
                if inclusions[-1] >= version:
795
 
                    raise WeaveFormatError("invalid included version %d for index %d"
796
 
                                           % (inclusions[-1], version))
797
 
 
798
 
        # try extracting all versions; parallel extraction is used
799
 
        nv = self.num_versions()
800
 
        sha1s = {}
801
 
        texts = {}
802
 
        inclusions = {}
803
 
        for i in range(nv):
804
 
            # For creating the ancestry, IntSet is much faster (3.7s vs 0.17s)
805
 
            # The problem is that set membership is much more expensive
806
 
            name = self._idx_to_name(i)
807
 
            sha1s[name] = sha()
808
 
            texts[name] = []
809
 
            new_inc = set([name])
810
 
            for p in self._parents[i]:
811
 
                new_inc.update(inclusions[self._idx_to_name(p)])
812
 
 
813
 
            if set(new_inc) != set(self.get_ancestry(name)):
814
 
                raise AssertionError(
815
 
                    'failed %s != %s'
816
 
                    % (set(new_inc), set(self.get_ancestry(name))))
817
 
            inclusions[name] = new_inc
818
 
 
819
 
        nlines = len(self._weave)
820
 
 
821
 
        update_text = 'checking weave'
822
 
        if self._weave_name:
823
 
            short_name = os.path.basename(self._weave_name)
824
 
            update_text = 'checking %s' % (short_name,)
825
 
            update_text = update_text[:25]
826
 
 
827
 
        for lineno, insert, deleteset, line in self._walk_internal():
828
 
            if progress_bar:
829
 
                progress_bar.update(update_text, lineno, nlines)
830
 
 
831
 
            for name, name_inclusions in inclusions.items():
832
 
                # The active inclusion must be an ancestor,
833
 
                # and no ancestors must have deleted this line,
834
 
                # because we don't support resurrection.
835
 
                if (insert in name_inclusions) and not (deleteset & name_inclusions):
836
 
                    sha1s[name].update(line)
837
 
 
838
 
        for i in range(nv):
839
 
            version = self._idx_to_name(i)
840
 
            hd = sha1s[version].hexdigest()
841
 
            expected = self._sha1s[i]
842
 
            if hd != expected:
843
 
                raise errors.WeaveInvalidChecksum(
844
 
                        "mismatched sha1 for version %s: "
845
 
                        "got %s, expected %s"
846
 
                        % (version, hd, expected))
847
 
 
848
 
        # TODO: check insertions are properly nested, that there are
849
 
        # no lines outside of insertion blocks, that deletions are
850
 
        # properly paired, etc.
851
 
 
852
 
    def _imported_parents(self, other, other_idx):
853
 
        """Return list of parents in self corresponding to indexes in other."""
854
 
        new_parents = []
855
 
        for parent_idx in other._parents[other_idx]:
856
 
            parent_name = other._names[parent_idx]
857
 
            if parent_name not in self._name_map:
858
 
                # should not be possible
859
 
                raise WeaveError("missing parent {%s} of {%s} in %r"
860
 
                                 % (parent_name, other._name_map[other_idx], self))
861
 
            new_parents.append(self._name_map[parent_name])
862
 
        return new_parents
863
 
 
864
 
    def _check_version_consistent(self, other, other_idx, name):
865
 
        """Check if a version in consistent in this and other.
866
 
 
867
 
        To be consistent it must have:
868
 
 
869
 
         * the same text
870
 
         * the same direct parents (by name, not index, and disregarding
871
 
           order)
872
 
 
873
 
        If present & correct return True;
874
 
        if not present in self return False;
875
 
        if inconsistent raise error."""
876
 
        this_idx = self._name_map.get(name, -1)
877
 
        if this_idx != -1:
878
 
            if self._sha1s[this_idx] != other._sha1s[other_idx]:
879
 
                raise errors.WeaveTextDiffers(name, self, other)
880
 
            self_parents = self._parents[this_idx]
881
 
            other_parents = other._parents[other_idx]
882
 
            n1 = set([self._names[i] for i in self_parents])
883
 
            n2 = set([other._names[i] for i in other_parents])
884
 
            if not self._compatible_parents(n1, n2):
885
 
                raise WeaveParentMismatch("inconsistent parents "
886
 
                    "for version {%s}: %s vs %s" % (name, n1, n2))
887
 
            else:
888
 
                return True         # ok!
889
 
        else:
890
 
            return False
891
 
 
892
 
    def _reweave(self, other, pb, msg):
893
 
        """Reweave self with other - internal helper for join().
894
 
 
895
 
        :param other: The other weave to merge
896
 
        :param pb: An optional progress bar, indicating how far done we are
897
 
        :param msg: An optional message for the progress
898
 
        """
899
 
        new_weave = _reweave(self, other, pb=pb, msg=msg)
900
 
        self._copy_weave_content(new_weave)
901
 
 
902
 
    def _copy_weave_content(self, otherweave):
903
 
        """adsorb the content from otherweave."""
904
 
        for attr in self.__slots__:
905
 
            if attr != '_weave_name':
906
 
                setattr(self, attr, copy(getattr(otherweave, attr)))
907
 
 
908
 
 
909
 
class WeaveFile(Weave):
910
 
    """A WeaveFile represents a Weave on disk and writes on change."""
911
 
 
912
 
    WEAVE_SUFFIX = '.weave'
913
 
 
914
 
    def __init__(self, name, transport, filemode=None, create=False, access_mode='w', get_scope=None):
915
 
        """Create a WeaveFile.
916
 
 
917
 
        :param create: If not True, only open an existing knit.
918
 
        """
919
 
        super(WeaveFile, self).__init__(name, access_mode, get_scope=get_scope,
920
 
            allow_reserved=False)
921
 
        self._transport = transport
922
 
        self._filemode = filemode
923
 
        try:
924
 
            _read_weave_v5(self._transport.get(name + WeaveFile.WEAVE_SUFFIX), self)
925
 
        except errors.NoSuchFile:
926
 
            if not create:
927
 
                raise
928
 
            # new file, save it
929
 
            self._save()
930
 
 
931
 
    def _add_lines(self, version_id, parents, lines, parent_texts,
932
 
        left_matching_blocks, nostore_sha, random_id, check_content):
933
 
        """Add a version and save the weave."""
934
 
        self.check_not_reserved_id(version_id)
935
 
        result = super(WeaveFile, self)._add_lines(version_id, parents, lines,
936
 
            parent_texts, left_matching_blocks, nostore_sha, random_id,
937
 
            check_content)
938
 
        self._save()
939
 
        return result
940
 
 
941
 
    def copy_to(self, name, transport):
942
 
        """See VersionedFile.copy_to()."""
943
 
        # as we are all in memory always, just serialise to the new place.
944
 
        sio = StringIO()
945
 
        write_weave_v5(self, sio)
946
 
        sio.seek(0)
947
 
        transport.put_file(name + WeaveFile.WEAVE_SUFFIX, sio, self._filemode)
948
 
 
949
 
    def _save(self):
950
 
        """Save the weave."""
951
 
        self._check_write_ok()
952
 
        sio = StringIO()
953
 
        write_weave_v5(self, sio)
954
 
        sio.seek(0)
955
 
        bytes = sio.getvalue()
956
 
        path = self._weave_name + WeaveFile.WEAVE_SUFFIX
957
 
        try:
958
 
            self._transport.put_bytes(path, bytes, self._filemode)
959
 
        except errors.NoSuchFile:
960
 
            self._transport.mkdir(dirname(path))
961
 
            self._transport.put_bytes(path, bytes, self._filemode)
962
 
 
963
 
    @staticmethod
964
 
    def get_suffixes():
965
 
        """See VersionedFile.get_suffixes()."""
966
 
        return [WeaveFile.WEAVE_SUFFIX]
967
 
 
968
 
    def insert_record_stream(self, stream):
969
 
        super(WeaveFile, self).insert_record_stream(stream)
970
 
        self._save()
971
 
 
972
 
    @deprecated_method(one_five)
973
 
    def join(self, other, pb=None, msg=None, version_ids=None,
974
 
             ignore_missing=False):
975
 
        """Join other into self and save."""
976
 
        super(WeaveFile, self).join(other, pb, msg, version_ids, ignore_missing)
977
 
        self._save()
978
 
 
979
 
 
980
 
def _reweave(wa, wb, pb=None, msg=None):
981
 
    """Combine two weaves and return the result.
982
 
 
983
 
    This works even if a revision R has different parents in
984
 
    wa and wb.  In the resulting weave all the parents are given.
985
 
 
986
 
    This is done by just building up a new weave, maintaining ordering
987
 
    of the versions in the two inputs.  More efficient approaches
988
 
    might be possible but it should only be necessary to do
989
 
    this operation rarely, when a new previously ghost version is
990
 
    inserted.
991
 
 
992
 
    :param pb: An optional progress bar, indicating how far done we are
993
 
    :param msg: An optional message for the progress
994
 
    """
995
 
    wr = Weave()
996
 
    ia = ib = 0
997
 
    queue_a = range(wa.num_versions())
998
 
    queue_b = range(wb.num_versions())
999
 
    # first determine combined parents of all versions
1000
 
    # map from version name -> all parent names
1001
 
    combined_parents = _reweave_parent_graphs(wa, wb)
1002
 
    mutter("combined parents: %r", combined_parents)
1003
 
    order = tsort.topo_sort(combined_parents.iteritems())
1004
 
    mutter("order to reweave: %r", order)
1005
 
 
1006
 
    if pb and not msg:
1007
 
        msg = 'reweave'
1008
 
 
1009
 
    for idx, name in enumerate(order):
1010
 
        if pb:
1011
 
            pb.update(msg, idx, len(order))
1012
 
        if name in wa._name_map:
1013
 
            lines = wa.get_lines(name)
1014
 
            if name in wb._name_map:
1015
 
                lines_b = wb.get_lines(name)
1016
 
                if lines != lines_b:
1017
 
                    mutter('Weaves differ on content. rev_id {%s}', name)
1018
 
                    mutter('weaves: %s, %s', wa._weave_name, wb._weave_name)
1019
 
                    import difflib
1020
 
                    lines = list(difflib.unified_diff(lines, lines_b,
1021
 
                            wa._weave_name, wb._weave_name))
1022
 
                    mutter('lines:\n%s', ''.join(lines))
1023
 
                    raise errors.WeaveTextDiffers(name, wa, wb)
1024
 
        else:
1025
 
            lines = wb.get_lines(name)
1026
 
        wr._add(name, lines, [wr._lookup(i) for i in combined_parents[name]])
1027
 
    return wr
1028
 
 
1029
 
def _reweave_parent_graphs(wa, wb):
1030
 
    """Return combined parent ancestry for two weaves.
1031
 
 
1032
 
    Returned as a list of (version_name, set(parent_names))"""
1033
 
    combined = {}
1034
 
    for weave in [wa, wb]:
1035
 
        for idx, name in enumerate(weave._names):
1036
 
            p = combined.setdefault(name, set())
1037
 
            p.update(map(weave._idx_to_name, weave._parents[idx]))
1038
 
    return combined
1039
 
 
1040
 
 
1041
 
def weave_toc(w):
1042
 
    """Show the weave's table-of-contents"""
1043
 
    print '%6s %50s %10s %10s' % ('ver', 'name', 'sha1', 'parents')
1044
 
    for i in (6, 50, 10, 10):
 
637
                    yield '<<<<\n'
 
638
                    for l in lines_a: yield l
 
639
                    yield '====\n'
 
640
                    for l in lines_b: yield l
 
641
                    yield '>>>>\n'
 
642
 
 
643
                del lines_a[:]
 
644
                del lines_b[:]
 
645
                ch_a = ch_b = False
 
646
                
 
647
            if state == 'unchanged':
 
648
                if line:
 
649
                    yield line
 
650
            elif state == 'killed-a':
 
651
                ch_a = True
 
652
                lines_b.append(line)
 
653
            elif state == 'killed-b':
 
654
                ch_b = True
 
655
                lines_a.append(line)
 
656
            elif state == 'new-a':
 
657
                ch_a = True
 
658
                lines_a.append(line)
 
659
            elif state == 'new-b':
 
660
                ch_b = True
 
661
                lines_b.append(line)
 
662
            else:
 
663
                assert state in ('irrelevant', 'ghost-a', 'ghost-b', 'killed-base',
 
664
                                 'killed-both'), \
 
665
                       state
 
666
 
 
667
                
 
668
 
 
669
 
 
670
 
 
671
 
 
672
 
 
673
def weave_info(w):
 
674
    """Show some text information about the weave."""
 
675
    print '%6s %40s %20s' % ('ver', 'sha1', 'parents')
 
676
    for i in (6, 40, 20):
1045
677
        print '-' * i,
1046
678
    print
1047
 
    for i in range(w.num_versions()):
 
679
    for i in range(w.numversions()):
1048
680
        sha1 = w._sha1s[i]
1049
 
        name = w._names[i]
1050
 
        parent_str = ' '.join(map(str, w._parents[i]))
1051
 
        print '%6d %-50.50s %10.10s %s' % (i, name, sha1, parent_str)
1052
 
 
1053
 
 
1054
 
 
1055
 
def weave_stats(weave_file, pb):
 
681
        print '%6d %40s %s' % (i, sha1, ' '.join(map(str, w._parents[i])))
 
682
 
 
683
 
 
684
 
 
685
def weave_stats(weave_file):
 
686
    from bzrlib.progress import ProgressBar
1056
687
    from bzrlib.weavefile import read_weave
1057
688
 
 
689
    pb = ProgressBar()
 
690
 
1058
691
    wf = file(weave_file, 'rb')
1059
692
    w = read_weave(wf)
1060
693
    # FIXME: doesn't work on pipes
1064
697
    vers = len(w)
1065
698
    for i in range(vers):
1066
699
        pb.update('checking sizes', i, vers)
1067
 
        for origin, lineno, line in w._extract([i]):
 
700
        for line in w.get_iter(i):
1068
701
            total += len(line)
1069
702
 
1070
703
    pb.clear()
1073
706
    print 'weave file        %9d bytes' % weave_size
1074
707
    print 'total contents    %9d bytes' % total
1075
708
    print 'compression ratio %9.2fx' % (float(total) / float(weave_size))
1076
 
    if vers:
1077
 
        avg = total/vers
1078
 
        print 'average size      %9d bytes' % avg
1079
 
        print 'relative size     %9.2fx' % (float(weave_size) / float(avg))
 
709
 
1080
710
 
1081
711
 
1082
712
def usage():
1091
721
        Write out specified version.
1092
722
    weave check WEAVEFILE
1093
723
        Check consistency of all versions.
1094
 
    weave toc WEAVEFILE
 
724
    weave info WEAVEFILE
1095
725
        Display table of contents.
1096
 
    weave add WEAVEFILE NAME [BASE...] < NEWTEXT
 
726
    weave add WEAVEFILE [BASE...] < NEWTEXT
1097
727
        Add NEWTEXT, with specified parent versions.
1098
728
    weave annotate WEAVEFILE VERSION
1099
729
        Display origin of each line.
 
730
    weave mash WEAVEFILE VERSION...
 
731
        Display composite of all selected versions.
1100
732
    weave merge WEAVEFILE VERSION1 VERSION2 > OUT
1101
733
        Auto-merge two versions and display conflicts.
1102
 
    weave diff WEAVEFILE VERSION1 VERSION2
1103
 
        Show differences between two versions.
1104
734
 
1105
735
example:
1106
736
 
1107
737
    % weave init foo.weave
1108
738
    % vi foo.txt
1109
 
    % weave add foo.weave ver0 < foo.txt
 
739
    % weave add foo.weave < foo.txt
1110
740
    added version 0
1111
741
 
1112
742
    (create updated version)
1113
743
    % vi foo.txt
1114
744
    % weave get foo.weave 0 | diff -u - foo.txt
1115
 
    % weave add foo.weave ver1 0 < foo.txt
 
745
    % weave add foo.weave 0 < foo.txt
1116
746
    added version 1
1117
747
 
1118
748
    % weave get foo.weave 0 > foo.txt       (create forked version)
1119
749
    % vi foo.txt
1120
 
    % weave add foo.weave ver2 0 < foo.txt
 
750
    % weave add foo.weave 0 < foo.txt
1121
751
    added version 2
1122
752
 
1123
753
    % weave merge foo.weave 1 2 > foo.txt   (merge them)
1124
754
    % vi foo.txt                            (resolve conflicts)
1125
 
    % weave add foo.weave merged 1 2 < foo.txt     (commit merged version)
1126
 
 
 
755
    % weave add foo.weave 1 2 < foo.txt     (commit merged version)     
 
756
    
1127
757
"""
1128
 
 
 
758
    
1129
759
 
1130
760
 
1131
761
def main(argv):
1132
762
    import sys
1133
763
    import os
1134
 
    try:
1135
 
        import bzrlib
1136
 
    except ImportError:
1137
 
        # in case we're run directly from the subdirectory
1138
 
        sys.path.append('..')
1139
 
        import bzrlib
1140
 
    from bzrlib.weavefile import write_weave, read_weave
 
764
    from weavefile import write_weave, read_weave
1141
765
    from bzrlib.progress import ProgressBar
1142
766
 
1143
 
    try:
1144
 
        import psyco
1145
 
        psyco.full()
1146
 
    except ImportError:
1147
 
        pass
1148
 
 
1149
 
    if len(argv) < 2:
1150
 
        usage()
1151
 
        return 0
 
767
    #import psyco
 
768
    #psyco.full()
1152
769
 
1153
770
    cmd = argv[1]
1154
771
 
1155
772
    def readit():
1156
773
        return read_weave(file(argv[2], 'rb'))
1157
 
 
 
774
    
1158
775
    if cmd == 'help':
1159
776
        usage()
1160
777
    elif cmd == 'add':
1161
778
        w = readit()
1162
779
        # at the moment, based on everything in the file
1163
 
        name = argv[3]
1164
 
        parents = map(int, argv[4:])
 
780
        parents = map(int, argv[3:])
1165
781
        lines = sys.stdin.readlines()
1166
 
        ver = w.add(name, parents, lines)
 
782
        ver = w.add(parents, lines)
1167
783
        write_weave(w, file(argv[2], 'wb'))
1168
 
        print 'added version %r %d' % (name, ver)
 
784
        print 'added version %d' % ver
1169
785
    elif cmd == 'init':
1170
786
        fn = argv[2]
1171
787
        if os.path.exists(fn):
1175
791
    elif cmd == 'get': # get one version
1176
792
        w = readit()
1177
793
        sys.stdout.writelines(w.get_iter(int(argv[3])))
1178
 
 
1179
 
    elif cmd == 'diff':
 
794
        
 
795
    elif cmd == 'mash': # get composite
1180
796
        w = readit()
1181
 
        fn = argv[2]
1182
 
        v1, v2 = map(int, argv[3:5])
1183
 
        lines1 = w.get(v1)
1184
 
        lines2 = w.get(v2)
1185
 
        diff_gen = bzrlib.patiencediff.unified_diff(lines1, lines2,
1186
 
                                '%s version %d' % (fn, v1),
1187
 
                                '%s version %d' % (fn, v2))
1188
 
        sys.stdout.writelines(diff_gen)
 
797
        sys.stdout.writelines(w.mash_iter(map(int, argv[3:])))
1189
798
 
1190
799
    elif cmd == 'annotate':
1191
800
        w = readit()
1199
808
            else:
1200
809
                print '%5d | %s' % (origin, text)
1201
810
                lasto = origin
1202
 
 
1203
 
    elif cmd == 'toc':
1204
 
        weave_toc(readit())
 
811
                
 
812
    elif cmd == 'info':
 
813
        weave_info(readit())
1205
814
 
1206
815
    elif cmd == 'stats':
1207
 
        weave_stats(argv[2], ProgressBar())
1208
 
 
 
816
        weave_stats(argv[2])
 
817
        
1209
818
    elif cmd == 'check':
1210
819
        w = readit()
1211
820
        pb = ProgressBar()
1212
821
        w.check(pb)
1213
822
        pb.clear()
1214
 
        print '%d versions ok' % w.num_versions()
 
823
        print '%d versions ok' % w.numversions()
1215
824
 
1216
825
    elif cmd == 'inclusions':
1217
826
        w = readit()
1222
831
        print ' '.join(map(str, w._parents[int(argv[3])]))
1223
832
 
1224
833
    elif cmd == 'plan-merge':
1225
 
        # replaced by 'bzr weave-plan-merge'
1226
834
        w = readit()
1227
835
        for state, line in w.plan_merge(int(argv[3]), int(argv[4])):
1228
836
            if line:
1229
837
                print '%14s | %s' % (state, line),
 
838
 
1230
839
    elif cmd == 'merge':
1231
 
        # replaced by 'bzr weave-merge-text'
1232
840
        w = readit()
1233
841
        p = w.plan_merge(int(argv[3]), int(argv[4]))
1234
842
        sys.stdout.writelines(w.weave_merge(p))
 
843
            
 
844
    elif cmd == 'mash-merge':
 
845
        if len(argv) != 5:
 
846
            usage()
 
847
            return 1
 
848
 
 
849
        w = readit()
 
850
        v1, v2 = map(int, argv[3:5])
 
851
 
 
852
        basis = w.inclusions([v1]).intersection(w.inclusions([v2]))
 
853
 
 
854
        base_lines = list(w.mash_iter(basis))
 
855
        a_lines = list(w.get(v1))
 
856
        b_lines = list(w.get(v2))
 
857
 
 
858
        from bzrlib.merge3 import Merge3
 
859
        m3 = Merge3(base_lines, a_lines, b_lines)
 
860
 
 
861
        name_a = 'version %d' % v1
 
862
        name_b = 'version %d' % v2
 
863
        sys.stdout.writelines(m3.merge_lines(name_a=name_a, name_b=name_b))
1235
864
    else:
1236
865
        raise ValueError('unknown command %r' % cmd)
1237
 
 
 
866
    
1238
867
 
1239
868
if __name__ == '__main__':
1240
869
    import sys