/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/tests/test_versionedfile.py

  • Committer: John Arbash Meinel
  • Date: 2006-04-25 15:05:42 UTC
  • mfrom: (1185.85.85 bzr-encoding)
  • mto: This revision was merged to the branch mainline in revision 1752.
  • Revision ID: john@arbash-meinel.com-20060425150542-c7b518dca9928691
[merge] the old bzr-encoding changes, reparenting them on bzr.dev

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2012, 2016 Canonical Ltd
 
1
# Copyright (C) 2005 by Canonical Ltd
2
2
#
3
3
# Authors:
4
4
#   Johan Rydberg <jrydberg@gnu.org>
7
7
# it under the terms of the GNU General Public License as published by
8
8
# the Free Software Foundation; either version 2 of the License, or
9
9
# (at your option) any later version.
10
 
#
 
10
 
11
11
# This program is distributed in the hope that it will be useful,
12
12
# but WITHOUT ANY WARRANTY; without even the implied warranty of
13
13
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14
14
# GNU General Public License for more details.
15
 
#
 
15
 
16
16
# You should have received a copy of the GNU General Public License
17
17
# along with this program; if not, write to the Free Software
18
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
19
 
 
20
 
 
21
 
# TODO: might be nice to create a versionedfile with some type of corruption
22
 
# considered typical and check that it can be detected/corrected.
23
 
 
24
 
from gzip import GzipFile
25
 
import itertools
26
 
 
27
 
from .. import (
28
 
    errors,
29
 
    graph as _mod_graph,
30
 
    osutils,
31
 
    progress,
32
 
    transport,
33
 
    ui,
34
 
    )
35
 
from ..bzr import (
36
 
    groupcompress,
37
 
    knit as _mod_knit,
38
 
    )
39
 
from ..errors import (
40
 
    RevisionNotPresent,
41
 
    RevisionAlreadyPresent,
42
 
    )
43
 
from ..bzr.knit import (
44
 
    cleanup_pack_knit,
45
 
    make_file_factory,
46
 
    make_pack_factory,
47
 
    )
48
 
from ..sixish import (
49
 
    BytesIO,
50
 
    zip,
51
 
    )
52
 
from . import (
53
 
    TestCase,
54
 
    TestCaseWithMemoryTransport,
55
 
    TestNotApplicable,
56
 
    TestSkipped,
57
 
    )
58
 
from .http_utils import TestCaseWithWebserver
59
 
from ..transport.memory import MemoryTransport
60
 
from ..bzr import versionedfile as versionedfile
61
 
from ..bzr.versionedfile import (
62
 
    ChunkedContentFactory,
63
 
    ConstantMapper,
64
 
    HashEscapedPrefixMapper,
65
 
    PrefixMapper,
66
 
    VirtualVersionedFiles,
67
 
    make_versioned_files_factory,
68
 
    )
69
 
from ..bzr.weave import (
70
 
    WeaveFile,
71
 
    WeaveInvalidChecksum,
72
 
    )
73
 
from ..bzr.weavefile import write_weave
74
 
from .scenarios import load_tests_apply_scenarios
75
 
 
76
 
 
77
 
load_tests = load_tests_apply_scenarios
78
 
 
79
 
 
80
 
def get_diamond_vf(f, trailing_eol=True, left_only=False):
81
 
    """Get a diamond graph to exercise deltas and merges.
82
 
 
83
 
    :param trailing_eol: If True end the last line with \n.
84
 
    """
85
 
    parents = {
86
 
        b'origin': (),
87
 
        b'base': ((b'origin',),),
88
 
        b'left': ((b'base',),),
89
 
        b'right': ((b'base',),),
90
 
        b'merged': ((b'left',), (b'right',)),
91
 
        }
92
 
    # insert a diamond graph to exercise deltas and merges.
93
 
    if trailing_eol:
94
 
        last_char = b'\n'
95
 
    else:
96
 
        last_char = b''
97
 
    f.add_lines(b'origin', [], [b'origin' + last_char])
98
 
    f.add_lines(b'base', [b'origin'], [b'base' + last_char])
99
 
    f.add_lines(b'left', [b'base'], [b'base\n', b'left' + last_char])
100
 
    if not left_only:
101
 
        f.add_lines(b'right', [b'base'],
102
 
                    [b'base\n', b'right' + last_char])
103
 
        f.add_lines(b'merged', [b'left', b'right'],
104
 
                    [b'base\n', b'left\n', b'right\n', b'merged' + last_char])
105
 
    return f, parents
106
 
 
107
 
 
108
 
def get_diamond_files(files, key_length, trailing_eol=True, left_only=False,
109
 
                      nograph=False, nokeys=False):
110
 
    """Get a diamond graph to exercise deltas and merges.
111
 
 
112
 
    This creates a 5-node graph in files. If files supports 2-length keys two
113
 
    graphs are made to exercise the support for multiple ids.
114
 
 
115
 
    :param trailing_eol: If True end the last line with \n.
116
 
    :param key_length: The length of keys in files. Currently supports length 1
117
 
        and 2 keys.
118
 
    :param left_only: If True do not add the right and merged nodes.
119
 
    :param nograph: If True, do not provide parents to the add_lines calls;
120
 
        this is useful for tests that need inserted data but have graphless
121
 
        stores.
122
 
    :param nokeys: If True, pass None is as the key for all insertions.
123
 
        Currently implies nograph.
124
 
    :return: The results of the add_lines calls.
125
 
    """
126
 
    if nokeys:
127
 
        nograph = True
128
 
    if key_length == 1:
129
 
        prefixes = [()]
130
 
    else:
131
 
        prefixes = [(b'FileA',), (b'FileB',)]
132
 
    # insert a diamond graph to exercise deltas and merges.
133
 
    if trailing_eol:
134
 
        last_char = b'\n'
135
 
    else:
136
 
        last_char = b''
137
 
    result = []
138
 
 
139
 
    def get_parents(suffix_list):
140
 
        if nograph:
141
 
            return ()
142
 
        else:
143
 
            result = [prefix + suffix for suffix in suffix_list]
144
 
            return result
145
 
 
146
 
    def get_key(suffix):
147
 
        if nokeys:
148
 
            return (None, )
149
 
        else:
150
 
            return (suffix,)
151
 
    # we loop over each key because that spreads the inserts across prefixes,
152
 
    # which is how commit operates.
153
 
    for prefix in prefixes:
154
 
        result.append(files.add_lines(prefix + get_key(b'origin'), (),
155
 
                                      [b'origin' + last_char]))
156
 
    for prefix in prefixes:
157
 
        result.append(files.add_lines(prefix + get_key(b'base'),
158
 
                                      get_parents([(b'origin',)]), [b'base' + last_char]))
159
 
    for prefix in prefixes:
160
 
        result.append(files.add_lines(prefix + get_key(b'left'),
161
 
                                      get_parents([(b'base',)]),
162
 
                                      [b'base\n', b'left' + last_char]))
163
 
    if not left_only:
164
 
        for prefix in prefixes:
165
 
            result.append(files.add_lines(prefix + get_key(b'right'),
166
 
                                          get_parents([(b'base',)]),
167
 
                                          [b'base\n', b'right' + last_char]))
168
 
        for prefix in prefixes:
169
 
            result.append(files.add_lines(prefix + get_key(b'merged'),
170
 
                                          get_parents(
171
 
                                              [(b'left',), (b'right',)]),
172
 
                                          [b'base\n', b'left\n', b'right\n', b'merged' + last_char]))
173
 
    return result
 
18
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
19
 
 
20
 
 
21
from StringIO import StringIO
 
22
 
 
23
import bzrlib
 
24
import bzrlib.errors as errors
 
25
from bzrlib.errors import (
 
26
                           RevisionNotPresent, 
 
27
                           RevisionAlreadyPresent,
 
28
                           WeaveParentMismatch
 
29
                           )
 
30
from bzrlib.knit import KnitVersionedFile, \
 
31
     KnitAnnotateFactory
 
32
from bzrlib.tests import TestCaseWithTransport
 
33
from bzrlib.tests.HTTPTestUtil import TestCaseWithWebserver
 
34
from bzrlib.trace import mutter
 
35
from bzrlib.transport import get_transport
 
36
from bzrlib.transport.memory import MemoryTransport
 
37
import bzrlib.versionedfile as versionedfile
 
38
from bzrlib.weave import WeaveFile
 
39
from bzrlib.weavefile import read_weave, write_weave
174
40
 
175
41
 
176
42
class VersionedFileTestMixIn(object):
181
47
    they are strictly controlled by their owning repositories.
182
48
    """
183
49
 
184
 
    def get_transaction(self):
185
 
        if not hasattr(self, '_transaction'):
186
 
            self._transaction = None
187
 
        return self._transaction
188
 
 
189
50
    def test_add(self):
190
51
        f = self.get_file()
191
 
        f.add_lines(b'r0', [], [b'a\n', b'b\n'])
192
 
        f.add_lines(b'r1', [b'r0'], [b'b\n', b'c\n'])
193
 
 
 
52
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
53
        f.add_lines('r1', ['r0'], ['b\n', 'c\n'])
194
54
        def verify_file(f):
195
55
            versions = f.versions()
196
 
            self.assertTrue(b'r0' in versions)
197
 
            self.assertTrue(b'r1' in versions)
198
 
            self.assertEqual(f.get_lines(b'r0'), [b'a\n', b'b\n'])
199
 
            self.assertEqual(f.get_text(b'r0'), b'a\nb\n')
200
 
            self.assertEqual(f.get_lines(b'r1'), [b'b\n', b'c\n'])
 
56
            self.assertTrue('r0' in versions)
 
57
            self.assertTrue('r1' in versions)
 
58
            self.assertEquals(f.get_lines('r0'), ['a\n', 'b\n'])
 
59
            self.assertEquals(f.get_text('r0'), 'a\nb\n')
 
60
            self.assertEquals(f.get_lines('r1'), ['b\n', 'c\n'])
201
61
            self.assertEqual(2, len(f))
202
62
            self.assertEqual(2, f.num_versions())
203
 
 
 
63
    
204
64
            self.assertRaises(RevisionNotPresent,
205
 
                              f.add_lines, b'r2', [b'foo'], [])
 
65
                f.add_lines, 'r2', ['foo'], [])
206
66
            self.assertRaises(RevisionAlreadyPresent,
207
 
                              f.add_lines, b'r1', [], [])
 
67
                f.add_lines, 'r1', [], [])
208
68
        verify_file(f)
209
69
        # this checks that reopen with create=True does not break anything.
210
70
        f = self.reopen_file(create=True)
213
73
    def test_adds_with_parent_texts(self):
214
74
        f = self.get_file()
215
75
        parent_texts = {}
216
 
        _, _, parent_texts[b'r0'] = f.add_lines(b'r0', [], [b'a\n', b'b\n'])
 
76
        parent_texts['r0'] = f.add_lines('r0', [], ['a\n', 'b\n'])
217
77
        try:
218
 
            _, _, parent_texts[b'r1'] = f.add_lines_with_ghosts(b'r1',
219
 
                                                                [b'r0', b'ghost'], [b'b\n', b'c\n'], parent_texts=parent_texts)
 
78
            parent_texts['r1'] = f.add_lines_with_ghosts('r1',
 
79
                                                         ['r0', 'ghost'], 
 
80
                                                         ['b\n', 'c\n'],
 
81
                                                         parent_texts=parent_texts)
220
82
        except NotImplementedError:
221
83
            # if the format doesn't support ghosts, just add normally.
222
 
            _, _, parent_texts[b'r1'] = f.add_lines(b'r1',
223
 
                                                    [b'r0'], [b'b\n', b'c\n'], parent_texts=parent_texts)
224
 
        f.add_lines(b'r2', [b'r1'], [b'c\n', b'd\n'],
225
 
                    parent_texts=parent_texts)
226
 
        self.assertNotEqual(None, parent_texts[b'r0'])
227
 
        self.assertNotEqual(None, parent_texts[b'r1'])
228
 
 
 
84
            parent_texts['r1'] = f.add_lines('r1',
 
85
                                             ['r0'], 
 
86
                                             ['b\n', 'c\n'],
 
87
                                             parent_texts=parent_texts)
 
88
        f.add_lines('r2', ['r1'], ['c\n', 'd\n'], parent_texts=parent_texts)
 
89
        self.assertNotEqual(None, parent_texts['r0'])
 
90
        self.assertNotEqual(None, parent_texts['r1'])
229
91
        def verify_file(f):
230
92
            versions = f.versions()
231
 
            self.assertTrue(b'r0' in versions)
232
 
            self.assertTrue(b'r1' in versions)
233
 
            self.assertTrue(b'r2' in versions)
234
 
            self.assertEqual(f.get_lines(b'r0'), [b'a\n', b'b\n'])
235
 
            self.assertEqual(f.get_lines(b'r1'), [b'b\n', b'c\n'])
236
 
            self.assertEqual(f.get_lines(b'r2'), [b'c\n', b'd\n'])
 
93
            self.assertTrue('r0' in versions)
 
94
            self.assertTrue('r1' in versions)
 
95
            self.assertTrue('r2' in versions)
 
96
            self.assertEquals(f.get_lines('r0'), ['a\n', 'b\n'])
 
97
            self.assertEquals(f.get_lines('r1'), ['b\n', 'c\n'])
 
98
            self.assertEquals(f.get_lines('r2'), ['c\n', 'd\n'])
237
99
            self.assertEqual(3, f.num_versions())
238
 
            origins = f.annotate(b'r1')
239
 
            self.assertEqual(origins[0][0], b'r0')
240
 
            self.assertEqual(origins[1][0], b'r1')
241
 
            origins = f.annotate(b'r2')
242
 
            self.assertEqual(origins[0][0], b'r1')
243
 
            self.assertEqual(origins[1][0], b'r2')
 
100
            origins = f.annotate('r1')
 
101
            self.assertEquals(origins[0][0], 'r0')
 
102
            self.assertEquals(origins[1][0], 'r1')
 
103
            origins = f.annotate('r2')
 
104
            self.assertEquals(origins[0][0], 'r1')
 
105
            self.assertEquals(origins[1][0], 'r2')
244
106
 
245
107
        verify_file(f)
246
108
        f = self.reopen_file()
247
109
        verify_file(f)
248
110
 
249
111
    def test_add_unicode_content(self):
250
 
        # unicode content is not permitted in versioned files.
 
112
        # unicode content is not permitted in versioned files. 
251
113
        # versioned files version sequences of bytes only.
252
114
        vf = self.get_file()
253
115
        self.assertRaises(errors.BzrBadParameterUnicode,
254
 
                          vf.add_lines, b'a', [], [b'a\n', u'b\n', b'c\n'])
 
116
            vf.add_lines, 'a', [], ['a\n', u'b\n', 'c\n'])
255
117
        self.assertRaises(
256
118
            (errors.BzrBadParameterUnicode, NotImplementedError),
257
 
            vf.add_lines_with_ghosts, b'a', [], [b'a\n', u'b\n', b'c\n'])
258
 
 
259
 
    def test_add_follows_left_matching_blocks(self):
260
 
        """If we change left_matching_blocks, delta changes
261
 
 
262
 
        Note: There are multiple correct deltas in this case, because
263
 
        we start with 1 "a" and we get 3.
264
 
        """
265
 
        vf = self.get_file()
266
 
        if isinstance(vf, WeaveFile):
267
 
            raise TestSkipped("WeaveFile ignores left_matching_blocks")
268
 
        vf.add_lines(b'1', [], [b'a\n'])
269
 
        vf.add_lines(b'2', [b'1'], [b'a\n', b'a\n', b'a\n'],
270
 
                     left_matching_blocks=[(0, 0, 1), (1, 3, 0)])
271
 
        self.assertEqual([b'a\n', b'a\n', b'a\n'], vf.get_lines(b'2'))
272
 
        vf.add_lines(b'3', [b'1'], [b'a\n', b'a\n', b'a\n'],
273
 
                     left_matching_blocks=[(0, 2, 1), (1, 3, 0)])
274
 
        self.assertEqual([b'a\n', b'a\n', b'a\n'], vf.get_lines(b'3'))
 
119
            vf.add_lines_with_ghosts, 'a', [], ['a\n', u'b\n', 'c\n'])
275
120
 
276
121
    def test_inline_newline_throws(self):
277
122
        # \r characters are not permitted in lines being added
278
123
        vf = self.get_file()
279
 
        self.assertRaises(errors.BzrBadParameterContainsNewline,
280
 
                          vf.add_lines, b'a', [], [b'a\n\n'])
 
124
        self.assertRaises(errors.BzrBadParameterContainsNewline, 
 
125
            vf.add_lines, 'a', [], ['a\n\n'])
281
126
        self.assertRaises(
282
127
            (errors.BzrBadParameterContainsNewline, NotImplementedError),
283
 
            vf.add_lines_with_ghosts, b'a', [], [b'a\n\n'])
 
128
            vf.add_lines_with_ghosts, 'a', [], ['a\n\n'])
284
129
        # but inline CR's are allowed
285
 
        vf.add_lines(b'a', [], [b'a\r\n'])
 
130
        vf.add_lines('a', [], ['a\r\n'])
286
131
        try:
287
 
            vf.add_lines_with_ghosts(b'b', [], [b'a\r\n'])
 
132
            vf.add_lines_with_ghosts('b', [], ['a\r\n'])
288
133
        except NotImplementedError:
289
134
            pass
290
135
 
291
 
    def test_add_reserved(self):
292
 
        vf = self.get_file()
293
 
        self.assertRaises(errors.ReservedId,
294
 
                          vf.add_lines, b'a:', [], [b'a\n', b'b\n', b'c\n'])
295
 
 
296
 
    def test_add_lines_nostoresha(self):
297
 
        """When nostore_sha is supplied using old content raises."""
298
 
        vf = self.get_file()
299
 
        empty_text = (b'a', [])
300
 
        sample_text_nl = (b'b', [b"foo\n", b"bar\n"])
301
 
        sample_text_no_nl = (b'c', [b"foo\n", b"bar"])
302
 
        shas = []
303
 
        for version, lines in (empty_text, sample_text_nl, sample_text_no_nl):
304
 
            sha, _, _ = vf.add_lines(version, [], lines)
305
 
            shas.append(sha)
306
 
        # we now have a copy of all the lines in the vf.
307
 
        for sha, (version, lines) in zip(
308
 
                shas, (empty_text, sample_text_nl, sample_text_no_nl)):
309
 
            self.assertRaises(errors.ExistingContent,
310
 
                              vf.add_lines, version + b"2", [], lines,
311
 
                              nostore_sha=sha)
312
 
            # and no new version should have been added.
313
 
            self.assertRaises(errors.RevisionNotPresent, vf.get_lines,
314
 
                              version + b"2")
315
 
 
316
 
    def test_add_lines_with_ghosts_nostoresha(self):
317
 
        """When nostore_sha is supplied using old content raises."""
318
 
        vf = self.get_file()
319
 
        empty_text = (b'a', [])
320
 
        sample_text_nl = (b'b', [b"foo\n", b"bar\n"])
321
 
        sample_text_no_nl = (b'c', [b"foo\n", b"bar"])
322
 
        shas = []
323
 
        for version, lines in (empty_text, sample_text_nl, sample_text_no_nl):
324
 
            sha, _, _ = vf.add_lines(version, [], lines)
325
 
            shas.append(sha)
326
 
        # we now have a copy of all the lines in the vf.
327
 
        # is the test applicable to this vf implementation?
328
 
        try:
329
 
            vf.add_lines_with_ghosts(b'd', [], [])
330
 
        except NotImplementedError:
331
 
            raise TestSkipped("add_lines_with_ghosts is optional")
332
 
        for sha, (version, lines) in zip(
333
 
                shas, (empty_text, sample_text_nl, sample_text_no_nl)):
334
 
            self.assertRaises(errors.ExistingContent,
335
 
                              vf.add_lines_with_ghosts, version + b"2", [], lines,
336
 
                              nostore_sha=sha)
337
 
            # and no new version should have been added.
338
 
            self.assertRaises(errors.RevisionNotPresent, vf.get_lines,
339
 
                              version + b"2")
340
 
 
341
 
    def test_add_lines_return_value(self):
342
 
        # add_lines should return the sha1 and the text size.
343
 
        vf = self.get_file()
344
 
        empty_text = (b'a', [])
345
 
        sample_text_nl = (b'b', [b"foo\n", b"bar\n"])
346
 
        sample_text_no_nl = (b'c', [b"foo\n", b"bar"])
347
 
        # check results for the three cases:
348
 
        for version, lines in (empty_text, sample_text_nl, sample_text_no_nl):
349
 
            # the first two elements are the same for all versioned files:
350
 
            # - the digest and the size of the text. For some versioned files
351
 
            #   additional data is returned in additional tuple elements.
352
 
            result = vf.add_lines(version, [], lines)
353
 
            self.assertEqual(3, len(result))
354
 
            self.assertEqual((osutils.sha_strings(lines), sum(map(len, lines))),
355
 
                             result[0:2])
356
 
        # parents should not affect the result:
357
 
        lines = sample_text_nl[1]
358
 
        self.assertEqual((osutils.sha_strings(lines), sum(map(len, lines))),
359
 
                         vf.add_lines(b'd', [b'b', b'c'], lines)[0:2])
360
 
 
361
 
    def test_get_reserved(self):
362
 
        vf = self.get_file()
363
 
        self.assertRaises(errors.ReservedId, vf.get_texts, [b'b:'])
364
 
        self.assertRaises(errors.ReservedId, vf.get_lines, b'b:')
365
 
        self.assertRaises(errors.ReservedId, vf.get_text, b'b:')
366
 
 
367
 
    def test_add_unchanged_last_line_noeol_snapshot(self):
368
 
        """Add a text with an unchanged last line with no eol should work."""
369
 
        # Test adding this in a number of chain lengths; because the interface
370
 
        # for VersionedFile does not allow forcing a specific chain length, we
371
 
        # just use a small base to get the first snapshot, then a much longer
372
 
        # first line for the next add (which will make the third add snapshot)
373
 
        # and so on. 20 has been chosen as an aribtrary figure - knits use 200
374
 
        # as a capped delta length, but ideally we would have some way of
375
 
        # tuning the test to the store (e.g. keep going until a snapshot
376
 
        # happens).
377
 
        for length in range(20):
378
 
            version_lines = {}
379
 
            vf = self.get_file('case-%d' % length)
380
 
            prefix = b'step-%d'
381
 
            parents = []
382
 
            for step in range(length):
383
 
                version = prefix % step
384
 
                lines = ([b'prelude \n'] * step) + [b'line']
385
 
                vf.add_lines(version, parents, lines)
386
 
                version_lines[version] = lines
387
 
                parents = [version]
388
 
            vf.add_lines(b'no-eol', parents, [b'line'])
389
 
            vf.get_texts(version_lines.keys())
390
 
            self.assertEqualDiff(b'line', vf.get_text(b'no-eol'))
391
 
 
392
 
    def test_get_texts_eol_variation(self):
393
 
        # similar to the failure in <http://bugs.launchpad.net/234748>
394
 
        vf = self.get_file()
395
 
        sample_text_nl = [b"line\n"]
396
 
        sample_text_no_nl = [b"line"]
397
 
        versions = []
398
 
        version_lines = {}
399
 
        parents = []
400
 
        for i in range(4):
401
 
            version = b'v%d' % i
402
 
            if i % 2:
403
 
                lines = sample_text_nl
404
 
            else:
405
 
                lines = sample_text_no_nl
406
 
            # left_matching blocks is an internal api; it operates on the
407
 
            # *internal* representation for a knit, which is with *all* lines
408
 
            # being normalised to end with \n - even the final line in a no_nl
409
 
            # file. Using it here ensures that a broken internal implementation
410
 
            # (which is what this test tests) will generate a correct line
411
 
            # delta (which is to say, an empty delta).
412
 
            vf.add_lines(version, parents, lines,
413
 
                         left_matching_blocks=[(0, 0, 1)])
414
 
            parents = [version]
415
 
            versions.append(version)
416
 
            version_lines[version] = lines
417
 
        vf.check()
418
 
        vf.get_texts(versions)
419
 
        vf.get_texts(reversed(versions))
420
 
 
421
 
    def test_add_lines_with_matching_blocks_noeol_last_line(self):
422
 
        """Add a text with an unchanged last line with no eol should work."""
423
 
        from breezy import multiparent
424
 
        # Hand verified sha1 of the text we're adding.
425
 
        sha1 = '6a1d115ec7b60afb664dc14890b5af5ce3c827a4'
426
 
        # Create a mpdiff which adds a new line before the trailing line, and
427
 
        # reuse the last line unaltered (which can cause annotation reuse).
428
 
        # Test adding this in two situations:
429
 
        # On top of a new insertion
430
 
        vf = self.get_file('fulltext')
431
 
        vf.add_lines(b'noeol', [], [b'line'])
432
 
        vf.add_lines(b'noeol2', [b'noeol'], [b'newline\n', b'line'],
433
 
                     left_matching_blocks=[(0, 1, 1)])
434
 
        self.assertEqualDiff(b'newline\nline', vf.get_text(b'noeol2'))
435
 
        # On top of a delta
436
 
        vf = self.get_file('delta')
437
 
        vf.add_lines(b'base', [], [b'line'])
438
 
        vf.add_lines(b'noeol', [b'base'], [b'prelude\n', b'line'])
439
 
        vf.add_lines(b'noeol2', [b'noeol'], [b'newline\n', b'line'],
440
 
                     left_matching_blocks=[(1, 1, 1)])
441
 
        self.assertEqualDiff(b'newline\nline', vf.get_text(b'noeol2'))
442
 
 
443
 
    def test_make_mpdiffs(self):
444
 
        from breezy import multiparent
445
 
        vf = self.get_file('foo')
446
 
        sha1s = self._setup_for_deltas(vf)
447
 
        new_vf = self.get_file('bar')
448
 
        for version in multiparent.topo_iter(vf):
449
 
            mpdiff = vf.make_mpdiffs([version])[0]
450
 
            new_vf.add_mpdiffs([(version, vf.get_parent_map([version])[version],
451
 
                                 vf.get_sha1s([version])[version], mpdiff)])
452
 
            self.assertEqualDiff(vf.get_text(version),
453
 
                                 new_vf.get_text(version))
454
 
 
455
 
    def test_make_mpdiffs_with_ghosts(self):
456
 
        vf = self.get_file('foo')
457
 
        try:
458
 
            vf.add_lines_with_ghosts(b'text', [b'ghost'], [b'line\n'])
459
 
        except NotImplementedError:
460
 
            # old Weave formats do not allow ghosts
461
 
            return
462
 
        self.assertRaises(errors.RevisionNotPresent,
463
 
                          vf.make_mpdiffs, [b'ghost'])
 
136
    def test_get_delta(self):
 
137
        f = self.get_file()
 
138
        sha1s = self._setup_for_deltas(f)
 
139
        expected_delta = (None, '6bfa09d82ce3e898ad4641ae13dd4fdb9cf0d76b', False, 
 
140
                          [(0, 0, 1, [('base', 'line\n')])])
 
141
        self.assertEqual(expected_delta, f.get_delta('base'))
 
142
        next_parent = 'base'
 
143
        text_name = 'chain1-'
 
144
        for depth in range(26):
 
145
            new_version = text_name + '%s' % depth
 
146
            expected_delta = (next_parent, sha1s[depth], 
 
147
                              False,
 
148
                              [(depth + 1, depth + 1, 1, [(new_version, 'line\n')])])
 
149
            self.assertEqual(expected_delta, f.get_delta(new_version))
 
150
            next_parent = new_version
 
151
        next_parent = 'base'
 
152
        text_name = 'chain2-'
 
153
        for depth in range(26):
 
154
            new_version = text_name + '%s' % depth
 
155
            expected_delta = (next_parent, sha1s[depth], False,
 
156
                              [(depth + 1, depth + 1, 1, [(new_version, 'line\n')])])
 
157
            self.assertEqual(expected_delta, f.get_delta(new_version))
 
158
            next_parent = new_version
 
159
        # smoke test for eol support
 
160
        expected_delta = ('base', '264f39cab871e4cfd65b3a002f7255888bb5ed97', True, [])
 
161
        self.assertEqual(['line'], f.get_lines('noeol'))
 
162
        self.assertEqual(expected_delta, f.get_delta('noeol'))
 
163
 
 
164
    def test_get_deltas(self):
 
165
        f = self.get_file()
 
166
        sha1s = self._setup_for_deltas(f)
 
167
        deltas = f.get_deltas(f.versions())
 
168
        expected_delta = (None, '6bfa09d82ce3e898ad4641ae13dd4fdb9cf0d76b', False, 
 
169
                          [(0, 0, 1, [('base', 'line\n')])])
 
170
        self.assertEqual(expected_delta, deltas['base'])
 
171
        next_parent = 'base'
 
172
        text_name = 'chain1-'
 
173
        for depth in range(26):
 
174
            new_version = text_name + '%s' % depth
 
175
            expected_delta = (next_parent, sha1s[depth], 
 
176
                              False,
 
177
                              [(depth + 1, depth + 1, 1, [(new_version, 'line\n')])])
 
178
            self.assertEqual(expected_delta, deltas[new_version])
 
179
            next_parent = new_version
 
180
        next_parent = 'base'
 
181
        text_name = 'chain2-'
 
182
        for depth in range(26):
 
183
            new_version = text_name + '%s' % depth
 
184
            expected_delta = (next_parent, sha1s[depth], False,
 
185
                              [(depth + 1, depth + 1, 1, [(new_version, 'line\n')])])
 
186
            self.assertEqual(expected_delta, deltas[new_version])
 
187
            next_parent = new_version
 
188
        # smoke tests for eol support
 
189
        expected_delta = ('base', '264f39cab871e4cfd65b3a002f7255888bb5ed97', True, [])
 
190
        self.assertEqual(['line'], f.get_lines('noeol'))
 
191
        self.assertEqual(expected_delta, deltas['noeol'])
 
192
        # smoke tests for eol support - two noeol in a row same content
 
193
        expected_deltas = (('noeol', '3ad7ee82dbd8f29ecba073f96e43e414b3f70a4d', True, 
 
194
                          [(0, 1, 2, [(u'noeolsecond', 'line\n'), (u'noeolsecond', 'line\n')])]),
 
195
                          ('noeol', '3ad7ee82dbd8f29ecba073f96e43e414b3f70a4d', True, 
 
196
                           [(0, 0, 1, [('noeolsecond', 'line\n')]), (1, 1, 0, [])]))
 
197
        self.assertEqual(['line\n', 'line'], f.get_lines('noeolsecond'))
 
198
        self.assertTrue(deltas['noeolsecond'] in expected_deltas)
 
199
        # two no-eol in a row, different content
 
200
        expected_delta = ('noeolsecond', '8bb553a84e019ef1149db082d65f3133b195223b', True, 
 
201
                          [(1, 2, 1, [(u'noeolnotshared', 'phone\n')])])
 
202
        self.assertEqual(['line\n', 'phone'], f.get_lines('noeolnotshared'))
 
203
        self.assertEqual(expected_delta, deltas['noeolnotshared'])
 
204
        # eol folling a no-eol with content change
 
205
        expected_delta = ('noeol', 'a61f6fb6cfc4596e8d88c34a308d1e724caf8977', False, 
 
206
                          [(0, 1, 1, [(u'eol', 'phone\n')])])
 
207
        self.assertEqual(['phone\n'], f.get_lines('eol'))
 
208
        self.assertEqual(expected_delta, deltas['eol'])
 
209
        # eol folling a no-eol with content change
 
210
        expected_delta = ('noeol', '6bfa09d82ce3e898ad4641ae13dd4fdb9cf0d76b', False, 
 
211
                          [(0, 1, 1, [(u'eolline', 'line\n')])])
 
212
        self.assertEqual(['line\n'], f.get_lines('eolline'))
 
213
        self.assertEqual(expected_delta, deltas['eolline'])
 
214
        # eol with no parents
 
215
        expected_delta = (None, '264f39cab871e4cfd65b3a002f7255888bb5ed97', True, 
 
216
                          [(0, 0, 1, [(u'noeolbase', 'line\n')])])
 
217
        self.assertEqual(['line'], f.get_lines('noeolbase'))
 
218
        self.assertEqual(expected_delta, deltas['noeolbase'])
 
219
        # eol with two parents, in inverse insertion order
 
220
        expected_deltas = (('noeolbase', '264f39cab871e4cfd65b3a002f7255888bb5ed97', True,
 
221
                            [(0, 1, 1, [(u'eolbeforefirstparent', 'line\n')])]),
 
222
                           ('noeolbase', '264f39cab871e4cfd65b3a002f7255888bb5ed97', True,
 
223
                            [(0, 1, 1, [(u'eolbeforefirstparent', 'line\n')])]))
 
224
        self.assertEqual(['line'], f.get_lines('eolbeforefirstparent'))
 
225
        #self.assertTrue(deltas['eolbeforefirstparent'] in expected_deltas)
464
226
 
465
227
    def _setup_for_deltas(self, f):
466
 
        self.assertFalse(f.has_version('base'))
 
228
        self.assertRaises(errors.RevisionNotPresent, f.get_delta, 'base')
467
229
        # add texts that should trip the knit maximum delta chain threshold
468
230
        # as well as doing parallel chains of data in knits.
469
231
        # this is done by two chains of 25 insertions
470
 
        f.add_lines(b'base', [], [b'line\n'])
471
 
        f.add_lines(b'noeol', [b'base'], [b'line'])
 
232
        f.add_lines('base', [], ['line\n'])
 
233
        f.add_lines('noeol', ['base'], ['line'])
472
234
        # detailed eol tests:
473
235
        # shared last line with parent no-eol
474
 
        f.add_lines(b'noeolsecond', [b'noeol'], [b'line\n', b'line'])
 
236
        f.add_lines('noeolsecond', ['noeol'], ['line\n', 'line'])
475
237
        # differing last line with parent, both no-eol
476
 
        f.add_lines(b'noeolnotshared', [b'noeolsecond'], [b'line\n', b'phone'])
 
238
        f.add_lines('noeolnotshared', ['noeolsecond'], ['line\n', 'phone'])
477
239
        # add eol following a noneol parent, change content
478
 
        f.add_lines(b'eol', [b'noeol'], [b'phone\n'])
 
240
        f.add_lines('eol', ['noeol'], ['phone\n'])
479
241
        # add eol following a noneol parent, no change content
480
 
        f.add_lines(b'eolline', [b'noeol'], [b'line\n'])
 
242
        f.add_lines('eolline', ['noeol'], ['line\n'])
481
243
        # noeol with no parents:
482
 
        f.add_lines(b'noeolbase', [], [b'line'])
 
244
        f.add_lines('noeolbase', [], ['line'])
483
245
        # noeol preceeding its leftmost parent in the output:
484
246
        # this is done by making it a merge of two parents with no common
485
 
        # anestry: noeolbase and noeol with the
 
247
        # anestry: noeolbase and noeol with the 
486
248
        # later-inserted parent the leftmost.
487
 
        f.add_lines(b'eolbeforefirstparent', [
488
 
                    b'noeolbase', b'noeol'], [b'line'])
 
249
        f.add_lines('eolbeforefirstparent', ['noeolbase', 'noeol'], ['line'])
489
250
        # two identical eol texts
490
 
        f.add_lines(b'noeoldup', [b'noeol'], [b'line'])
491
 
        next_parent = b'base'
492
 
        text_name = b'chain1-'
493
 
        text = [b'line\n']
494
 
        sha1s = {0: b'da6d3141cb4a5e6f464bf6e0518042ddc7bfd079',
495
 
                 1: b'45e21ea146a81ea44a821737acdb4f9791c8abe7',
496
 
                 2: b'e1f11570edf3e2a070052366c582837a4fe4e9fa',
497
 
                 3: b'26b4b8626da827088c514b8f9bbe4ebf181edda1',
498
 
                 4: b'e28a5510be25ba84d31121cff00956f9970ae6f6',
499
 
                 5: b'd63ec0ce22e11dcf65a931b69255d3ac747a318d',
500
 
                 6: b'2c2888d288cb5e1d98009d822fedfe6019c6a4ea',
501
 
                 7: b'95c14da9cafbf828e3e74a6f016d87926ba234ab',
502
 
                 8: b'779e9a0b28f9f832528d4b21e17e168c67697272',
503
 
                 9: b'1f8ff4e5c6ff78ac106fcfe6b1e8cb8740ff9a8f',
504
 
                 10: b'131a2ae712cf51ed62f143e3fbac3d4206c25a05',
505
 
                 11: b'c5a9d6f520d2515e1ec401a8f8a67e6c3c89f199',
506
 
                 12: b'31a2286267f24d8bedaa43355f8ad7129509ea85',
507
 
                 13: b'dc2a7fe80e8ec5cae920973973a8ee28b2da5e0a',
508
 
                 14: b'2c4b1736566b8ca6051e668de68650686a3922f2',
509
 
                 15: b'5912e4ecd9b0c07be4d013e7e2bdcf9323276cde',
510
 
                 16: b'b0d2e18d3559a00580f6b49804c23fea500feab3',
511
 
                 17: b'8e1d43ad72f7562d7cb8f57ee584e20eb1a69fc7',
512
 
                 18: b'5cf64a3459ae28efa60239e44b20312d25b253f3',
513
 
                 19: b'1ebed371807ba5935958ad0884595126e8c4e823',
514
 
                 20: b'2aa62a8b06fb3b3b892a3292a068ade69d5ee0d3',
515
 
                 21: b'01edc447978004f6e4e962b417a4ae1955b6fe5d',
516
 
                 22: b'd8d8dc49c4bf0bab401e0298bb5ad827768618bb',
517
 
                 23: b'c21f62b1c482862983a8ffb2b0c64b3451876e3f',
518
 
                 24: b'c0593fe795e00dff6b3c0fe857a074364d5f04fc',
519
 
                 25: b'dd1a1cf2ba9cc225c3aff729953e6364bf1d1855',
 
251
        f.add_lines('noeoldup', ['noeol'], ['line'])
 
252
        next_parent = 'base'
 
253
        text_name = 'chain1-'
 
254
        text = ['line\n']
 
255
        sha1s = {0 :'da6d3141cb4a5e6f464bf6e0518042ddc7bfd079',
 
256
                 1 :'45e21ea146a81ea44a821737acdb4f9791c8abe7',
 
257
                 2 :'e1f11570edf3e2a070052366c582837a4fe4e9fa',
 
258
                 3 :'26b4b8626da827088c514b8f9bbe4ebf181edda1',
 
259
                 4 :'e28a5510be25ba84d31121cff00956f9970ae6f6',
 
260
                 5 :'d63ec0ce22e11dcf65a931b69255d3ac747a318d',
 
261
                 6 :'2c2888d288cb5e1d98009d822fedfe6019c6a4ea',
 
262
                 7 :'95c14da9cafbf828e3e74a6f016d87926ba234ab',
 
263
                 8 :'779e9a0b28f9f832528d4b21e17e168c67697272',
 
264
                 9 :'1f8ff4e5c6ff78ac106fcfe6b1e8cb8740ff9a8f',
 
265
                 10:'131a2ae712cf51ed62f143e3fbac3d4206c25a05',
 
266
                 11:'c5a9d6f520d2515e1ec401a8f8a67e6c3c89f199',
 
267
                 12:'31a2286267f24d8bedaa43355f8ad7129509ea85',
 
268
                 13:'dc2a7fe80e8ec5cae920973973a8ee28b2da5e0a',
 
269
                 14:'2c4b1736566b8ca6051e668de68650686a3922f2',
 
270
                 15:'5912e4ecd9b0c07be4d013e7e2bdcf9323276cde',
 
271
                 16:'b0d2e18d3559a00580f6b49804c23fea500feab3',
 
272
                 17:'8e1d43ad72f7562d7cb8f57ee584e20eb1a69fc7',
 
273
                 18:'5cf64a3459ae28efa60239e44b20312d25b253f3',
 
274
                 19:'1ebed371807ba5935958ad0884595126e8c4e823',
 
275
                 20:'2aa62a8b06fb3b3b892a3292a068ade69d5ee0d3',
 
276
                 21:'01edc447978004f6e4e962b417a4ae1955b6fe5d',
 
277
                 22:'d8d8dc49c4bf0bab401e0298bb5ad827768618bb',
 
278
                 23:'c21f62b1c482862983a8ffb2b0c64b3451876e3f',
 
279
                 24:'c0593fe795e00dff6b3c0fe857a074364d5f04fc',
 
280
                 25:'dd1a1cf2ba9cc225c3aff729953e6364bf1d1855',
520
281
                 }
521
282
        for depth in range(26):
522
 
            new_version = text_name + b'%d' % depth
523
 
            text = text + [b'line\n']
 
283
            new_version = text_name + '%s' % depth
 
284
            text = text + ['line\n']
524
285
            f.add_lines(new_version, [next_parent], text)
525
286
            next_parent = new_version
526
 
        next_parent = b'base'
527
 
        text_name = b'chain2-'
528
 
        text = [b'line\n']
 
287
        next_parent = 'base'
 
288
        text_name = 'chain2-'
 
289
        text = ['line\n']
529
290
        for depth in range(26):
530
 
            new_version = text_name + b'%d' % depth
531
 
            text = text + [b'line\n']
 
291
            new_version = text_name + '%s' % depth
 
292
            text = text + ['line\n']
532
293
            f.add_lines(new_version, [next_parent], text)
533
294
            next_parent = new_version
534
295
        return sha1s
535
296
 
 
297
    def test_add_delta(self):
 
298
        # tests for the add-delta facility.
 
299
        # at this point, optimising for speed, we assume no checks when deltas are inserted.
 
300
        # this may need to be revisited.
 
301
        source = self.get_file('source')
 
302
        source.add_lines('base', [], ['line\n'])
 
303
        next_parent = 'base'
 
304
        text_name = 'chain1-'
 
305
        text = ['line\n']
 
306
        for depth in range(26):
 
307
            new_version = text_name + '%s' % depth
 
308
            text = text + ['line\n']
 
309
            source.add_lines(new_version, [next_parent], text)
 
310
            next_parent = new_version
 
311
        next_parent = 'base'
 
312
        text_name = 'chain2-'
 
313
        text = ['line\n']
 
314
        for depth in range(26):
 
315
            new_version = text_name + '%s' % depth
 
316
            text = text + ['line\n']
 
317
            source.add_lines(new_version, [next_parent], text)
 
318
            next_parent = new_version
 
319
        source.add_lines('noeol', ['base'], ['line'])
 
320
        
 
321
        target = self.get_file('target')
 
322
        for version in source.versions():
 
323
            parent, sha1, noeol, delta = source.get_delta(version)
 
324
            target.add_delta(version,
 
325
                             source.get_parents(version),
 
326
                             parent,
 
327
                             sha1,
 
328
                             noeol,
 
329
                             delta)
 
330
        self.assertRaises(RevisionAlreadyPresent,
 
331
                          target.add_delta, 'base', [], None, '', False, [])
 
332
        for version in source.versions():
 
333
            self.assertEqual(source.get_lines(version),
 
334
                             target.get_lines(version))
 
335
 
536
336
    def test_ancestry(self):
537
337
        f = self.get_file()
538
338
        self.assertEqual([], f.get_ancestry([]))
539
 
        f.add_lines(b'r0', [], [b'a\n', b'b\n'])
540
 
        f.add_lines(b'r1', [b'r0'], [b'b\n', b'c\n'])
541
 
        f.add_lines(b'r2', [b'r0'], [b'b\n', b'c\n'])
542
 
        f.add_lines(b'r3', [b'r2'], [b'b\n', b'c\n'])
543
 
        f.add_lines(b'rM', [b'r1', b'r2'], [b'b\n', b'c\n'])
 
339
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
340
        f.add_lines('r1', ['r0'], ['b\n', 'c\n'])
 
341
        f.add_lines('r2', ['r0'], ['b\n', 'c\n'])
 
342
        f.add_lines('r3', ['r2'], ['b\n', 'c\n'])
 
343
        f.add_lines('rM', ['r1', 'r2'], ['b\n', 'c\n'])
544
344
        self.assertEqual([], f.get_ancestry([]))
545
 
        versions = f.get_ancestry([b'rM'])
 
345
        versions = f.get_ancestry(['rM'])
546
346
        # there are some possibilities:
547
347
        # r0 r1 r2 rM r3
548
348
        # r0 r1 r2 r3 rM
549
349
        # etc
550
350
        # so we check indexes
551
 
        r0 = versions.index(b'r0')
552
 
        r1 = versions.index(b'r1')
553
 
        r2 = versions.index(b'r2')
554
 
        self.assertFalse(b'r3' in versions)
555
 
        rM = versions.index(b'rM')
 
351
        r0 = versions.index('r0')
 
352
        r1 = versions.index('r1')
 
353
        r2 = versions.index('r2')
 
354
        self.assertFalse('r3' in versions)
 
355
        rM = versions.index('rM')
556
356
        self.assertTrue(r0 < r1)
557
357
        self.assertTrue(r0 < r2)
558
358
        self.assertTrue(r1 < rM)
559
359
        self.assertTrue(r2 < rM)
560
360
 
561
361
        self.assertRaises(RevisionNotPresent,
562
 
                          f.get_ancestry, [b'rM', b'rX'])
563
 
 
564
 
        self.assertEqual(set(f.get_ancestry(b'rM')),
565
 
                         set(f.get_ancestry(b'rM', topo_sorted=False)))
 
362
            f.get_ancestry, ['rM', 'rX'])
566
363
 
567
364
    def test_mutate_after_finish(self):
568
 
        self._transaction = 'before'
569
 
        f = self.get_file()
570
 
        self._transaction = 'after'
571
 
        self.assertRaises(errors.OutSideTransaction, f.add_lines, b'', [], [])
572
 
        self.assertRaises(errors.OutSideTransaction,
573
 
                          f.add_lines_with_ghosts, b'', [], [])
 
365
        f = self.get_file()
 
366
        f.transaction_finished()
 
367
        self.assertRaises(errors.OutSideTransaction, f.add_delta, '', [], '', '', False, [])
 
368
        self.assertRaises(errors.OutSideTransaction, f.add_lines, '', [], [])
 
369
        self.assertRaises(errors.OutSideTransaction, f.add_lines_with_ghosts, '', [], [])
 
370
        self.assertRaises(errors.OutSideTransaction, f.fix_parents, '', [])
 
371
        self.assertRaises(errors.OutSideTransaction, f.join, '')
 
372
        self.assertRaises(errors.OutSideTransaction, f.clone_text, 'base', 'bar', ['foo'])
 
373
        
 
374
    def test_clear_cache(self):
 
375
        f = self.get_file()
 
376
        # on a new file it should not error
 
377
        f.clear_cache()
 
378
        # and after adding content, doing a clear_cache and a get should work.
 
379
        f.add_lines('0', [], ['a'])
 
380
        f.clear_cache()
 
381
        self.assertEqual(['a'], f.get_lines('0'))
 
382
 
 
383
    def test_clone_text(self):
 
384
        f = self.get_file()
 
385
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
386
        f.clone_text('r1', 'r0', ['r0'])
 
387
        def verify_file(f):
 
388
            self.assertEquals(f.get_lines('r1'), f.get_lines('r0'))
 
389
            self.assertEquals(f.get_lines('r1'), ['a\n', 'b\n'])
 
390
            self.assertEquals(f.get_parents('r1'), ['r0'])
 
391
    
 
392
            self.assertRaises(RevisionNotPresent,
 
393
                f.clone_text, 'r2', 'rX', [])
 
394
            self.assertRaises(RevisionAlreadyPresent,
 
395
                f.clone_text, 'r1', 'r0', [])
 
396
        verify_file(f)
 
397
        verify_file(self.reopen_file())
 
398
 
 
399
    def test_create_empty(self):
 
400
        f = self.get_file()
 
401
        f.add_lines('0', [], ['a\n'])
 
402
        new_f = f.create_empty('t', MemoryTransport())
 
403
        # smoke test, specific types should check it is honoured correctly for
 
404
        # non type attributes
 
405
        self.assertEqual([], new_f.versions())
 
406
        self.assertTrue(isinstance(new_f, f.__class__))
574
407
 
575
408
    def test_copy_to(self):
576
409
        f = self.get_file()
577
 
        f.add_lines(b'0', [], [b'a\n'])
 
410
        f.add_lines('0', [], ['a\n'])
578
411
        t = MemoryTransport()
579
412
        f.copy_to('foo', t)
580
 
        for suffix in self.get_factory().get_suffixes():
 
413
        for suffix in f.__class__.get_suffixes():
581
414
            self.assertTrue(t.has('foo' + suffix))
582
415
 
583
416
    def test_get_suffixes(self):
584
417
        f = self.get_file()
 
418
        # should be the same
 
419
        self.assertEqual(f.__class__.get_suffixes(), f.__class__.get_suffixes())
585
420
        # and should be a list
586
 
        self.assertTrue(isinstance(self.get_factory().get_suffixes(), list))
587
 
 
588
 
    def test_get_parent_map(self):
589
 
        f = self.get_file()
590
 
        f.add_lines(b'r0', [], [b'a\n', b'b\n'])
591
 
        self.assertEqual(
592
 
            {b'r0': ()}, f.get_parent_map([b'r0']))
593
 
        f.add_lines(b'r1', [b'r0'], [b'a\n', b'b\n'])
594
 
        self.assertEqual(
595
 
            {b'r1': (b'r0',)}, f.get_parent_map([b'r1']))
596
 
        self.assertEqual(
597
 
            {b'r0': (),
598
 
             b'r1': (b'r0',)},
599
 
            f.get_parent_map([b'r0', b'r1']))
600
 
        f.add_lines(b'r2', [], [b'a\n', b'b\n'])
601
 
        f.add_lines(b'r3', [], [b'a\n', b'b\n'])
602
 
        f.add_lines(b'm', [b'r0', b'r1', b'r2', b'r3'], [b'a\n', b'b\n'])
603
 
        self.assertEqual(
604
 
            {b'm': (b'r0', b'r1', b'r2', b'r3')}, f.get_parent_map([b'm']))
605
 
        self.assertEqual({}, f.get_parent_map(b'y'))
606
 
        self.assertEqual(
607
 
            {b'r0': (),
608
 
             b'r1': (b'r0',)},
609
 
            f.get_parent_map([b'r0', b'y', b'r1']))
 
421
        self.assertTrue(isinstance(f.__class__.get_suffixes(), list))
 
422
 
 
423
    def test_get_graph(self):
 
424
        f = self.get_file()
 
425
        f.add_lines('v1', [], ['hello\n'])
 
426
        f.add_lines('v2', ['v1'], ['hello\n', 'world\n'])
 
427
        f.add_lines('v3', ['v2'], ['hello\n', 'cruel\n', 'world\n'])
 
428
        self.assertEqual({'v1': [],
 
429
                          'v2': ['v1'],
 
430
                          'v3': ['v2']},
 
431
                         f.get_graph())
 
432
 
 
433
    def test_get_parents(self):
 
434
        f = self.get_file()
 
435
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
436
        f.add_lines('r1', [], ['a\n', 'b\n'])
 
437
        f.add_lines('r2', [], ['a\n', 'b\n'])
 
438
        f.add_lines('r3', [], ['a\n', 'b\n'])
 
439
        f.add_lines('m', ['r0', 'r1', 'r2', 'r3'], ['a\n', 'b\n'])
 
440
        self.assertEquals(f.get_parents('m'), ['r0', 'r1', 'r2', 'r3'])
 
441
 
 
442
        self.assertRaises(RevisionNotPresent,
 
443
            f.get_parents, 'y')
610
444
 
611
445
    def test_annotate(self):
612
446
        f = self.get_file()
613
 
        f.add_lines(b'r0', [], [b'a\n', b'b\n'])
614
 
        f.add_lines(b'r1', [b'r0'], [b'c\n', b'b\n'])
615
 
        origins = f.annotate(b'r1')
616
 
        self.assertEqual(origins[0][0], b'r1')
617
 
        self.assertEqual(origins[1][0], b'r0')
 
447
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
448
        f.add_lines('r1', ['r0'], ['c\n', 'b\n'])
 
449
        origins = f.annotate('r1')
 
450
        self.assertEquals(origins[0][0], 'r1')
 
451
        self.assertEquals(origins[1][0], 'r0')
618
452
 
619
453
        self.assertRaises(RevisionNotPresent,
620
 
                          f.annotate, b'foo')
 
454
            f.annotate, 'foo')
 
455
 
 
456
    def test_walk(self):
 
457
        # tests that walk returns all the inclusions for the requested
 
458
        # revisions as well as the revisions changes themselves.
 
459
        f = self.get_file('1')
 
460
        f.add_lines('r0', [], ['a\n', 'b\n'])
 
461
        f.add_lines('r1', ['r0'], ['c\n', 'b\n'])
 
462
        f.add_lines('rX', ['r1'], ['d\n', 'b\n'])
 
463
        f.add_lines('rY', ['r1'], ['c\n', 'e\n'])
 
464
 
 
465
        lines = {}
 
466
        for lineno, insert, dset, text in f.walk(['rX', 'rY']):
 
467
            lines[text] = (insert, dset)
 
468
 
 
469
        self.assertTrue(lines['a\n'], ('r0', set(['r1'])))
 
470
        self.assertTrue(lines['b\n'], ('r0', set(['rY'])))
 
471
        self.assertTrue(lines['c\n'], ('r1', set(['rX'])))
 
472
        self.assertTrue(lines['d\n'], ('rX', set([])))
 
473
        self.assertTrue(lines['e\n'], ('rY', set([])))
621
474
 
622
475
    def test_detection(self):
623
476
        # Test weaves detect corruption.
628
481
 
629
482
        w = self.get_file_corrupted_text()
630
483
 
631
 
        self.assertEqual(b'hello\n', w.get_text(b'v1'))
632
 
        self.assertRaises(WeaveInvalidChecksum, w.get_text, b'v2')
633
 
        self.assertRaises(WeaveInvalidChecksum, w.get_lines, b'v2')
634
 
        self.assertRaises(WeaveInvalidChecksum, w.check)
 
484
        self.assertEqual('hello\n', w.get_text('v1'))
 
485
        self.assertRaises(errors.WeaveInvalidChecksum, w.get_text, 'v2')
 
486
        self.assertRaises(errors.WeaveInvalidChecksum, w.get_lines, 'v2')
 
487
        self.assertRaises(errors.WeaveInvalidChecksum, w.check)
635
488
 
636
489
        w = self.get_file_corrupted_checksum()
637
490
 
638
 
        self.assertEqual(b'hello\n', w.get_text(b'v1'))
639
 
        self.assertRaises(WeaveInvalidChecksum, w.get_text, b'v2')
640
 
        self.assertRaises(WeaveInvalidChecksum, w.get_lines, b'v2')
641
 
        self.assertRaises(WeaveInvalidChecksum, w.check)
 
491
        self.assertEqual('hello\n', w.get_text('v1'))
 
492
        self.assertRaises(errors.WeaveInvalidChecksum, w.get_text, 'v2')
 
493
        self.assertRaises(errors.WeaveInvalidChecksum, w.get_lines, 'v2')
 
494
        self.assertRaises(errors.WeaveInvalidChecksum, w.check)
642
495
 
643
496
    def get_file_corrupted_text(self):
644
497
        """Return a versioned file with corrupt text but valid metadata."""
650
503
 
651
504
    def test_iter_lines_added_or_present_in_versions(self):
652
505
        # test that we get at least an equalset of the lines added by
653
 
        # versions in the weave
 
506
        # versions in the weave 
654
507
        # the ordering here is to make a tree so that dumb searches have
655
508
        # more changes to muck up.
656
 
 
657
 
        class InstrumentedProgress(progress.ProgressTask):
658
 
 
659
 
            def __init__(self):
660
 
                progress.ProgressTask.__init__(self)
661
 
                self.updates = []
662
 
 
663
 
            def update(self, msg=None, current=None, total=None):
664
 
                self.updates.append((msg, current, total))
665
 
 
666
509
        vf = self.get_file()
667
510
        # add a base to get included
668
 
        vf.add_lines(b'base', [], [b'base\n'])
 
511
        vf.add_lines('base', [], ['base\n'])
669
512
        # add a ancestor to be included on one side
670
 
        vf.add_lines(b'lancestor', [], [b'lancestor\n'])
 
513
        vf.add_lines('lancestor', [], ['lancestor\n'])
671
514
        # add a ancestor to be included on the other side
672
 
        vf.add_lines(b'rancestor', [b'base'], [b'rancestor\n'])
 
515
        vf.add_lines('rancestor', ['base'], ['rancestor\n'])
673
516
        # add a child of rancestor with no eofile-nl
674
 
        vf.add_lines(b'child', [b'rancestor'], [b'base\n', b'child\n'])
 
517
        vf.add_lines('child', ['rancestor'], ['base\n', 'child\n'])
675
518
        # add a child of lancestor and base to join the two roots
676
 
        vf.add_lines(b'otherchild',
677
 
                     [b'lancestor', b'base'],
678
 
                     [b'base\n', b'lancestor\n', b'otherchild\n'])
679
 
 
680
 
        def iter_with_versions(versions, expected):
 
519
        vf.add_lines('otherchild',
 
520
                     ['lancestor', 'base'],
 
521
                     ['base\n', 'lancestor\n', 'otherchild\n'])
 
522
        def iter_with_versions(versions):
681
523
            # now we need to see what lines are returned, and how often.
682
 
            lines = {}
683
 
            progress = InstrumentedProgress()
 
524
            lines = {'base\n':0,
 
525
                     'lancestor\n':0,
 
526
                     'rancestor\n':0,
 
527
                     'child\n':0,
 
528
                     'otherchild\n':0,
 
529
                     }
684
530
            # iterate over the lines
685
 
            for line in vf.iter_lines_added_or_present_in_versions(versions,
686
 
                                                                   pb=progress):
687
 
                lines.setdefault(line, 0)
 
531
            for line in vf.iter_lines_added_or_present_in_versions(versions):
688
532
                lines[line] += 1
689
 
            if [] != progress.updates:
690
 
                self.assertEqual(expected, progress.updates)
691
533
            return lines
692
 
        lines = iter_with_versions([b'child', b'otherchild'],
693
 
                                   [('Walking content', 0, 2),
694
 
                                    ('Walking content', 1, 2),
695
 
                                    ('Walking content', 2, 2)])
 
534
        lines = iter_with_versions(['child', 'otherchild'])
696
535
        # we must see child and otherchild
697
 
        self.assertTrue(lines[(b'child\n', b'child')] > 0)
698
 
        self.assertTrue(lines[(b'otherchild\n', b'otherchild')] > 0)
 
536
        self.assertTrue(lines['child\n'] > 0)
 
537
        self.assertTrue(lines['otherchild\n'] > 0)
699
538
        # we dont care if we got more than that.
700
 
 
 
539
        
701
540
        # test all lines
702
 
        lines = iter_with_versions(None, [('Walking content', 0, 5),
703
 
                                          ('Walking content', 1, 5),
704
 
                                          ('Walking content', 2, 5),
705
 
                                          ('Walking content', 3, 5),
706
 
                                          ('Walking content', 4, 5),
707
 
                                          ('Walking content', 5, 5)])
 
541
        lines = iter_with_versions(None)
708
542
        # all lines must be seen at least once
709
 
        self.assertTrue(lines[(b'base\n', b'base')] > 0)
710
 
        self.assertTrue(lines[(b'lancestor\n', b'lancestor')] > 0)
711
 
        self.assertTrue(lines[(b'rancestor\n', b'rancestor')] > 0)
712
 
        self.assertTrue(lines[(b'child\n', b'child')] > 0)
713
 
        self.assertTrue(lines[(b'otherchild\n', b'otherchild')] > 0)
 
543
        self.assertTrue(lines['base\n'] > 0)
 
544
        self.assertTrue(lines['lancestor\n'] > 0)
 
545
        self.assertTrue(lines['rancestor\n'] > 0)
 
546
        self.assertTrue(lines['child\n'] > 0)
 
547
        self.assertTrue(lines['otherchild\n'] > 0)
 
548
 
 
549
    def test_fix_parents(self):
 
550
        # some versioned files allow incorrect parents to be corrected after
 
551
        # insertion - this may not fix ancestry..
 
552
        # if they do not supported, they just do not implement it.
 
553
        # we test this as an interface test to ensure that those that *do*
 
554
        # implementent it get it right.
 
555
        vf = self.get_file()
 
556
        vf.add_lines('notbase', [], [])
 
557
        vf.add_lines('base', [], [])
 
558
        try:
 
559
            vf.fix_parents('notbase', ['base'])
 
560
        except NotImplementedError:
 
561
            return
 
562
        self.assertEqual(['base'], vf.get_parents('notbase'))
 
563
        # open again, check it stuck.
 
564
        vf = self.get_file()
 
565
        self.assertEqual(['base'], vf.get_parents('notbase'))
 
566
 
 
567
    def test_fix_parents_with_ghosts(self):
 
568
        # when fixing parents, ghosts that are listed should not be ghosts
 
569
        # anymore.
 
570
        vf = self.get_file()
 
571
 
 
572
        try:
 
573
            vf.add_lines_with_ghosts('notbase', ['base', 'stillghost'], [])
 
574
        except NotImplementedError:
 
575
            return
 
576
        vf.add_lines('base', [], [])
 
577
        vf.fix_parents('notbase', ['base', 'stillghost'])
 
578
        self.assertEqual(['base'], vf.get_parents('notbase'))
 
579
        # open again, check it stuck.
 
580
        vf = self.get_file()
 
581
        self.assertEqual(['base'], vf.get_parents('notbase'))
 
582
        # and check the ghosts
 
583
        self.assertEqual(['base', 'stillghost'],
 
584
                         vf.get_parents_with_ghosts('notbase'))
714
585
 
715
586
    def test_add_lines_with_ghosts(self):
716
587
        # some versioned file formats allow lines to be added with parent
719
590
        # add_lines_with_ghosts api.
720
591
        vf = self.get_file()
721
592
        # add a revision with ghost parents
722
 
        # The preferred form is utf8, but we should translate when needed
723
 
        parent_id_unicode = u'b\xbfse'
724
 
        parent_id_utf8 = parent_id_unicode.encode('utf8')
725
593
        try:
726
 
            vf.add_lines_with_ghosts(b'notbxbfse', [parent_id_utf8], [])
 
594
            vf.add_lines_with_ghosts(u'notbxbfse', [u'b\xbfse'], [])
727
595
        except NotImplementedError:
728
596
            # check the other ghost apis are also not implemented
729
 
            self.assertRaises(NotImplementedError,
730
 
                              vf.get_ancestry_with_ghosts, [b'foo'])
731
 
            self.assertRaises(NotImplementedError,
732
 
                              vf.get_parents_with_ghosts, b'foo')
 
597
            self.assertRaises(NotImplementedError, vf.has_ghost, 'foo')
 
598
            self.assertRaises(NotImplementedError, vf.get_ancestry_with_ghosts, ['foo'])
 
599
            self.assertRaises(NotImplementedError, vf.get_parents_with_ghosts, 'foo')
 
600
            self.assertRaises(NotImplementedError, vf.get_graph_with_ghosts)
733
601
            return
734
 
        vf = self.reopen_file()
735
602
        # test key graph related apis: getncestry, _graph, get_parents
736
603
        # has_version
737
604
        # - these are ghost unaware and must not be reflect ghosts
738
 
        self.assertEqual([b'notbxbfse'], vf.get_ancestry(b'notbxbfse'))
739
 
        self.assertFalse(vf.has_version(parent_id_utf8))
 
605
        self.assertEqual([u'notbxbfse'], vf.get_ancestry(u'notbxbfse'))
 
606
        self.assertEqual([], vf.get_parents(u'notbxbfse'))
 
607
        self.assertEqual({u'notbxbfse':[]}, vf.get_graph())
 
608
        self.assertFalse(vf.has_version(u'b\xbfse'))
740
609
        # we have _with_ghost apis to give us ghost information.
741
 
        self.assertEqual([parent_id_utf8, b'notbxbfse'],
742
 
                         vf.get_ancestry_with_ghosts([b'notbxbfse']))
743
 
        self.assertEqual([parent_id_utf8],
744
 
                         vf.get_parents_with_ghosts(b'notbxbfse'))
 
610
        self.assertEqual([u'b\xbfse', u'notbxbfse'], vf.get_ancestry_with_ghosts([u'notbxbfse']))
 
611
        self.assertEqual([u'b\xbfse'], vf.get_parents_with_ghosts(u'notbxbfse'))
 
612
        self.assertEqual({u'notbxbfse':[u'b\xbfse']}, vf.get_graph_with_ghosts())
 
613
        self.assertTrue(vf.has_ghost(u'b\xbfse'))
745
614
        # if we add something that is a ghost of another, it should correct the
746
615
        # results of the prior apis
747
 
        vf.add_lines(parent_id_utf8, [], [])
748
 
        self.assertEqual([parent_id_utf8, b'notbxbfse'],
749
 
                         vf.get_ancestry([b'notbxbfse']))
750
 
        self.assertEqual({b'notbxbfse': (parent_id_utf8,)},
751
 
                         vf.get_parent_map([b'notbxbfse']))
752
 
        self.assertTrue(vf.has_version(parent_id_utf8))
 
616
        vf.add_lines(u'b\xbfse', [], [])
 
617
        self.assertEqual([u'b\xbfse', u'notbxbfse'], vf.get_ancestry([u'notbxbfse']))
 
618
        self.assertEqual([u'b\xbfse'], vf.get_parents(u'notbxbfse'))
 
619
        self.assertEqual({u'b\xbfse':[],
 
620
                          u'notbxbfse':[u'b\xbfse'],
 
621
                          },
 
622
                         vf.get_graph())
 
623
        self.assertTrue(vf.has_version(u'b\xbfse'))
753
624
        # we have _with_ghost apis to give us ghost information.
754
 
        self.assertEqual([parent_id_utf8, b'notbxbfse'],
755
 
                         vf.get_ancestry_with_ghosts([b'notbxbfse']))
756
 
        self.assertEqual([parent_id_utf8],
757
 
                         vf.get_parents_with_ghosts(b'notbxbfse'))
 
625
        self.assertEqual([u'b\xbfse', u'notbxbfse'], vf.get_ancestry_with_ghosts([u'notbxbfse']))
 
626
        self.assertEqual([u'b\xbfse'], vf.get_parents_with_ghosts(u'notbxbfse'))
 
627
        self.assertEqual({u'b\xbfse':[],
 
628
                          u'notbxbfse':[u'b\xbfse'],
 
629
                          },
 
630
                         vf.get_graph_with_ghosts())
 
631
        self.assertFalse(vf.has_ghost(u'b\xbfse'))
758
632
 
759
633
    def test_add_lines_with_ghosts_after_normal_revs(self):
760
634
        # some versioned file formats allow lines to be added with parent
764
638
        vf = self.get_file()
765
639
        # probe for ghost support
766
640
        try:
767
 
            vf.add_lines_with_ghosts(b'base', [], [b'line\n', b'line_b\n'])
 
641
            vf.has_ghost('hoo')
768
642
        except NotImplementedError:
769
643
            return
770
 
        vf.add_lines_with_ghosts(b'references_ghost',
771
 
                                 [b'base', b'a_ghost'],
772
 
                                 [b'line\n', b'line_b\n', b'line_c\n'])
773
 
        origins = vf.annotate(b'references_ghost')
774
 
        self.assertEqual((b'base', b'line\n'), origins[0])
775
 
        self.assertEqual((b'base', b'line_b\n'), origins[1])
776
 
        self.assertEqual((b'references_ghost', b'line_c\n'), origins[2])
 
644
        vf.add_lines_with_ghosts('base', [], ['line\n', 'line_b\n'])
 
645
        vf.add_lines_with_ghosts('references_ghost',
 
646
                                 ['base', 'a_ghost'],
 
647
                                 ['line\n', 'line_b\n', 'line_c\n'])
 
648
        origins = vf.annotate('references_ghost')
 
649
        self.assertEquals(('base', 'line\n'), origins[0])
 
650
        self.assertEquals(('base', 'line_b\n'), origins[1])
 
651
        self.assertEquals(('references_ghost', 'line_c\n'), origins[2])
777
652
 
778
653
    def test_readonly_mode(self):
779
 
        t = self.get_transport()
 
654
        transport = get_transport(self.get_url('.'))
780
655
        factory = self.get_factory()
781
 
        vf = factory('id', t, 0o777, create=True, access_mode='w')
782
 
        vf = factory('id', t, access_mode='r')
783
 
        self.assertRaises(errors.ReadOnlyError, vf.add_lines, b'base', [], [])
 
656
        vf = factory('id', transport, 0777, create=True, access_mode='w')
 
657
        vf = factory('id', transport, access_mode='r')
 
658
        self.assertRaises(errors.ReadOnlyError, vf.add_delta, '', [], '', '', False, [])
 
659
        self.assertRaises(errors.ReadOnlyError, vf.add_lines, 'base', [], [])
784
660
        self.assertRaises(errors.ReadOnlyError,
785
661
                          vf.add_lines_with_ghosts,
786
 
                          b'base',
 
662
                          'base',
787
663
                          [],
788
664
                          [])
789
 
 
790
 
    def test_get_sha1s(self):
 
665
        self.assertRaises(errors.ReadOnlyError, vf.fix_parents, 'base', [])
 
666
        self.assertRaises(errors.ReadOnlyError, vf.join, 'base')
 
667
        self.assertRaises(errors.ReadOnlyError, vf.clone_text, 'base', 'bar', ['foo'])
 
668
    
 
669
    def test_get_sha1(self):
791
670
        # check the sha1 data is available
792
671
        vf = self.get_file()
793
672
        # a simple file
794
 
        vf.add_lines(b'a', [], [b'a\n'])
 
673
        vf.add_lines('a', [], ['a\n'])
795
674
        # the same file, different metadata
796
 
        vf.add_lines(b'b', [b'a'], [b'a\n'])
 
675
        vf.add_lines('b', ['a'], ['a\n'])
797
676
        # a file differing only in last newline.
798
 
        vf.add_lines(b'c', [], [b'a'])
799
 
        self.assertEqual({
800
 
            b'a': b'3f786850e387550fdab836ed7e6dc881de23001b',
801
 
            b'c': b'86f7e437faa5a7fce15d1ddcb9eaeaea377667b8',
802
 
            b'b': b'3f786850e387550fdab836ed7e6dc881de23001b',
803
 
            },
804
 
            vf.get_sha1s([b'a', b'c', b'b']))
805
 
 
806
 
 
807
 
class TestWeave(TestCaseWithMemoryTransport, VersionedFileTestMixIn):
 
677
        vf.add_lines('c', [], ['a'])
 
678
        self.assertEqual(
 
679
            '3f786850e387550fdab836ed7e6dc881de23001b', vf.get_sha1('a'))
 
680
        self.assertEqual(
 
681
            '3f786850e387550fdab836ed7e6dc881de23001b', vf.get_sha1('b'))
 
682
        self.assertEqual(
 
683
            '86f7e437faa5a7fce15d1ddcb9eaeaea377667b8', vf.get_sha1('c'))
 
684
        
 
685
 
 
686
class TestWeave(TestCaseWithTransport, VersionedFileTestMixIn):
808
687
 
809
688
    def get_file(self, name='foo'):
810
 
        return WeaveFile(name, self.get_transport(),
811
 
                         create=True,
812
 
                         get_scope=self.get_transaction)
 
689
        return WeaveFile(name, get_transport(self.get_url('.')), create=True)
813
690
 
814
691
    def get_file_corrupted_text(self):
815
 
        w = WeaveFile('foo', self.get_transport(),
816
 
                      create=True,
817
 
                      get_scope=self.get_transaction)
818
 
        w.add_lines(b'v1', [], [b'hello\n'])
819
 
        w.add_lines(b'v2', [b'v1'], [b'hello\n', b'there\n'])
820
 
 
 
692
        w = WeaveFile('foo', get_transport(self.get_url('.')), create=True)
 
693
        w.add_lines('v1', [], ['hello\n'])
 
694
        w.add_lines('v2', ['v1'], ['hello\n', 'there\n'])
 
695
        
821
696
        # We are going to invasively corrupt the text
822
697
        # Make sure the internals of weave are the same
823
 
        self.assertEqual([(b'{', 0), b'hello\n', (b'}', None), (b'{', 1), b'there\n', (b'}', None)
824
 
                          ], w._weave)
825
 
 
826
 
        self.assertEqual([b'f572d396fae9206628714fb2ce00f72e94f2258f', b'90f265c6e75f1c8f9ab76dcf85528352c5f215ef'
827
 
                          ], w._sha1s)
 
698
        self.assertEqual([('{', 0)
 
699
                        , 'hello\n'
 
700
                        , ('}', None)
 
701
                        , ('{', 1)
 
702
                        , 'there\n'
 
703
                        , ('}', None)
 
704
                        ], w._weave)
 
705
        
 
706
        self.assertEqual(['f572d396fae9206628714fb2ce00f72e94f2258f'
 
707
                        , '90f265c6e75f1c8f9ab76dcf85528352c5f215ef'
 
708
                        ], w._sha1s)
828
709
        w.check()
829
 
 
 
710
        
830
711
        # Corrupted
831
 
        w._weave[4] = b'There\n'
 
712
        w._weave[4] = 'There\n'
832
713
        return w
833
714
 
834
715
    def get_file_corrupted_checksum(self):
835
716
        w = self.get_file_corrupted_text()
836
717
        # Corrected
837
 
        w._weave[4] = b'there\n'
838
 
        self.assertEqual(b'hello\nthere\n', w.get_text(b'v2'))
839
 
 
840
 
        # Invalid checksum, first digit changed
841
 
        w._sha1s[1] = b'f0f265c6e75f1c8f9ab76dcf85528352c5f215ef'
 
718
        w._weave[4] = 'there\n'
 
719
        self.assertEqual('hello\nthere\n', w.get_text('v2'))
 
720
        
 
721
        #Invalid checksum, first digit changed
 
722
        w._sha1s[1] =  'f0f265c6e75f1c8f9ab76dcf85528352c5f215ef'
842
723
        return w
843
724
 
844
725
    def reopen_file(self, name='foo', create=False):
845
 
        return WeaveFile(name, self.get_transport(),
846
 
                         create=create,
847
 
                         get_scope=self.get_transaction)
 
726
        return WeaveFile(name, get_transport(self.get_url('.')), create=create)
848
727
 
849
728
    def test_no_implicit_create(self):
850
729
        self.assertRaises(errors.NoSuchFile,
851
730
                          WeaveFile,
852
731
                          'foo',
853
 
                          self.get_transport(),
854
 
                          get_scope=self.get_transaction)
 
732
                          get_transport(self.get_url('.')))
855
733
 
856
734
    def get_factory(self):
857
735
        return WeaveFile
858
736
 
859
737
 
860
 
class TestPlanMergeVersionedFile(TestCaseWithMemoryTransport):
861
 
 
862
 
    def setUp(self):
863
 
        super(TestPlanMergeVersionedFile, self).setUp()
864
 
        mapper = PrefixMapper()
865
 
        factory = make_file_factory(True, mapper)
866
 
        self.vf1 = factory(self.get_transport('root-1'))
867
 
        self.vf2 = factory(self.get_transport('root-2'))
868
 
        self.plan_merge_vf = versionedfile._PlanMergeVersionedFile('root')
869
 
        self.plan_merge_vf.fallback_versionedfiles.extend([self.vf1, self.vf2])
870
 
 
871
 
    def test_add_lines(self):
872
 
        self.plan_merge_vf.add_lines((b'root', b'a:'), [], [])
873
 
        self.assertRaises(ValueError, self.plan_merge_vf.add_lines,
874
 
                          (b'root', b'a'), [], [])
875
 
        self.assertRaises(ValueError, self.plan_merge_vf.add_lines,
876
 
                          (b'root', b'a:'), None, [])
877
 
        self.assertRaises(ValueError, self.plan_merge_vf.add_lines,
878
 
                          (b'root', b'a:'), [], None)
879
 
 
880
 
    def setup_abcde(self):
881
 
        self.vf1.add_lines((b'root', b'A'), [], [b'a'])
882
 
        self.vf1.add_lines((b'root', b'B'), [(b'root', b'A')], [b'b'])
883
 
        self.vf2.add_lines((b'root', b'C'), [], [b'c'])
884
 
        self.vf2.add_lines((b'root', b'D'), [(b'root', b'C')], [b'd'])
885
 
        self.plan_merge_vf.add_lines((b'root', b'E:'),
886
 
                                     [(b'root', b'B'), (b'root', b'D')], [b'e'])
887
 
 
888
 
    def test_get_parents(self):
889
 
        self.setup_abcde()
890
 
        self.assertEqual({(b'root', b'B'): ((b'root', b'A'),)},
891
 
                         self.plan_merge_vf.get_parent_map([(b'root', b'B')]))
892
 
        self.assertEqual({(b'root', b'D'): ((b'root', b'C'),)},
893
 
                         self.plan_merge_vf.get_parent_map([(b'root', b'D')]))
894
 
        self.assertEqual({(b'root', b'E:'): ((b'root', b'B'), (b'root', b'D'))},
895
 
                         self.plan_merge_vf.get_parent_map([(b'root', b'E:')]))
896
 
        self.assertEqual({},
897
 
                         self.plan_merge_vf.get_parent_map([(b'root', b'F')]))
898
 
        self.assertEqual({
899
 
            (b'root', b'B'): ((b'root', b'A'),),
900
 
            (b'root', b'D'): ((b'root', b'C'),),
901
 
            (b'root', b'E:'): ((b'root', b'B'), (b'root', b'D')),
902
 
            },
903
 
            self.plan_merge_vf.get_parent_map(
904
 
                [(b'root', b'B'), (b'root', b'D'), (b'root', b'E:'), (b'root', b'F')]))
905
 
 
906
 
    def test_get_record_stream(self):
907
 
        self.setup_abcde()
908
 
 
909
 
        def get_record(suffix):
910
 
            return next(self.plan_merge_vf.get_record_stream(
911
 
                [(b'root', suffix)], 'unordered', True))
912
 
        self.assertEqual(b'a', get_record(b'A').get_bytes_as('fulltext'))
913
 
        self.assertEqual(b'a', b''.join(get_record(b'A').iter_bytes_as('chunked')))
914
 
        self.assertEqual(b'c', get_record(b'C').get_bytes_as('fulltext'))
915
 
        self.assertEqual(b'e', get_record(b'E:').get_bytes_as('fulltext'))
916
 
        self.assertEqual('absent', get_record('F').storage_kind)
 
738
class TestKnit(TestCaseWithTransport, VersionedFileTestMixIn):
 
739
 
 
740
    def get_file(self, name='foo'):
 
741
        return KnitVersionedFile(name, get_transport(self.get_url('.')),
 
742
                                 delta=True, create=True)
 
743
 
 
744
    def get_factory(self):
 
745
        return KnitVersionedFile
 
746
 
 
747
    def get_file_corrupted_text(self):
 
748
        knit = self.get_file()
 
749
        knit.add_lines('v1', [], ['hello\n'])
 
750
        knit.add_lines('v2', ['v1'], ['hello\n', 'there\n'])
 
751
        return knit
 
752
 
 
753
    def reopen_file(self, name='foo', create=False):
 
754
        return KnitVersionedFile(name, get_transport(self.get_url('.')),
 
755
            delta=True,
 
756
            create=create)
 
757
 
 
758
    def test_detection(self):
 
759
        print "TODO for merging: create a corrupted knit."
 
760
        knit = self.get_file()
 
761
        knit.check()
 
762
 
 
763
    def test_no_implicit_create(self):
 
764
        self.assertRaises(errors.NoSuchFile,
 
765
                          KnitVersionedFile,
 
766
                          'foo',
 
767
                          get_transport(self.get_url('.')))
 
768
 
 
769
 
 
770
class InterString(versionedfile.InterVersionedFile):
 
771
    """An inter-versionedfile optimised code path for strings.
 
772
 
 
773
    This is for use during testing where we use strings as versionedfiles
 
774
    so that none of the default regsitered interversionedfile classes will
 
775
    match - which lets us test the match logic.
 
776
    """
 
777
 
 
778
    @staticmethod
 
779
    def is_compatible(source, target):
 
780
        """InterString is compatible with strings-as-versionedfiles."""
 
781
        return isinstance(source, str) and isinstance(target, str)
 
782
 
 
783
 
 
784
# TODO this and the InterRepository core logic should be consolidatable
 
785
# if we make the registry a separate class though we still need to 
 
786
# test the behaviour in the active registry to catch failure-to-handle-
 
787
# stange-objects
 
788
class TestInterVersionedFile(TestCaseWithTransport):
 
789
 
 
790
    def test_get_default_inter_versionedfile(self):
 
791
        # test that the InterVersionedFile.get(a, b) probes
 
792
        # for a class where is_compatible(a, b) returns
 
793
        # true and returns a default interversionedfile otherwise.
 
794
        # This also tests that the default registered optimised interversionedfile
 
795
        # classes do not barf inappropriately when a surprising versionedfile type
 
796
        # is handed to them.
 
797
        dummy_a = "VersionedFile 1."
 
798
        dummy_b = "VersionedFile 2."
 
799
        self.assertGetsDefaultInterVersionedFile(dummy_a, dummy_b)
 
800
 
 
801
    def assertGetsDefaultInterVersionedFile(self, a, b):
 
802
        """Asserts that InterVersionedFile.get(a, b) -> the default."""
 
803
        inter = versionedfile.InterVersionedFile.get(a, b)
 
804
        self.assertEqual(versionedfile.InterVersionedFile,
 
805
                         inter.__class__)
 
806
        self.assertEqual(a, inter.source)
 
807
        self.assertEqual(b, inter.target)
 
808
 
 
809
    def test_register_inter_versionedfile_class(self):
 
810
        # test that a optimised code path provider - a
 
811
        # InterVersionedFile subclass can be registered and unregistered
 
812
        # and that it is correctly selected when given a versionedfile
 
813
        # pair that it returns true on for the is_compatible static method
 
814
        # check
 
815
        dummy_a = "VersionedFile 1."
 
816
        dummy_b = "VersionedFile 2."
 
817
        versionedfile.InterVersionedFile.register_optimiser(InterString)
 
818
        try:
 
819
            # we should get the default for something InterString returns False
 
820
            # to
 
821
            self.assertFalse(InterString.is_compatible(dummy_a, None))
 
822
            self.assertGetsDefaultInterVersionedFile(dummy_a, None)
 
823
            # and we should get an InterString for a pair it 'likes'
 
824
            self.assertTrue(InterString.is_compatible(dummy_a, dummy_b))
 
825
            inter = versionedfile.InterVersionedFile.get(dummy_a, dummy_b)
 
826
            self.assertEqual(InterString, inter.__class__)
 
827
            self.assertEqual(dummy_a, inter.source)
 
828
            self.assertEqual(dummy_b, inter.target)
 
829
        finally:
 
830
            versionedfile.InterVersionedFile.unregister_optimiser(InterString)
 
831
        # now we should get the default InterVersionedFile object again.
 
832
        self.assertGetsDefaultInterVersionedFile(dummy_a, dummy_b)
917
833
 
918
834
 
919
835
class TestReadonlyHttpMixin(object):
920
836
 
921
 
    def get_transaction(self):
922
 
        return 1
923
 
 
924
837
    def test_readonly_http_works(self):
925
838
        # we should be able to read from http with a versioned file.
926
839
        vf = self.get_file()
927
840
        # try an empty file access
928
 
        readonly_vf = self.get_factory()('foo',
929
 
                                         transport.get_transport_from_url(self.get_readonly_url('.')))
 
841
        readonly_vf = self.get_factory()('foo', get_transport(self.get_readonly_url('.')))
930
842
        self.assertEqual([], readonly_vf.versions())
931
 
 
932
 
    def test_readonly_http_works_with_feeling(self):
933
 
        # we should be able to read from http with a versioned file.
934
 
        vf = self.get_file()
935
843
        # now with feeling.
936
 
        vf.add_lines(b'1', [], [b'a\n'])
937
 
        vf.add_lines(b'2', [b'1'], [b'b\n', b'a\n'])
938
 
        readonly_vf = self.get_factory()('foo',
939
 
                                         transport.get_transport_from_url(self.get_readonly_url('.')))
940
 
        self.assertEqual([b'1', b'2'], vf.versions())
941
 
        self.assertEqual([b'1', b'2'], readonly_vf.versions())
 
844
        vf.add_lines('1', [], ['a\n'])
 
845
        vf.add_lines('2', ['1'], ['b\n', 'a\n'])
 
846
        readonly_vf = self.get_factory()('foo', get_transport(self.get_readonly_url('.')))
 
847
        self.assertEqual(['1', '2'], vf.versions())
942
848
        for version in readonly_vf.versions():
943
849
            readonly_vf.get_lines(version)
944
850
 
946
852
class TestWeaveHTTP(TestCaseWithWebserver, TestReadonlyHttpMixin):
947
853
 
948
854
    def get_file(self):
949
 
        return WeaveFile('foo', self.get_transport(),
950
 
                         create=True,
951
 
                         get_scope=self.get_transaction)
 
855
        return WeaveFile('foo', get_transport(self.get_url('.')), create=True)
952
856
 
953
857
    def get_factory(self):
954
858
        return WeaveFile
955
859
 
956
860
 
 
861
class TestKnitHTTP(TestCaseWithWebserver, TestReadonlyHttpMixin):
 
862
 
 
863
    def get_file(self):
 
864
        return KnitVersionedFile('foo', get_transport(self.get_url('.')),
 
865
                                 delta=True, create=True)
 
866
 
 
867
    def get_factory(self):
 
868
        return KnitVersionedFile
 
869
 
 
870
 
957
871
class MergeCasesMixin(object):
958
872
 
959
873
    def doMerge(self, base, a, b, mp):
 
874
        from cStringIO import StringIO
960
875
        from textwrap import dedent
961
876
 
962
877
        def addcrlf(x):
963
 
            return x + b'\n'
964
 
 
 
878
            return x + '\n'
 
879
        
965
880
        w = self.get_file()
966
 
        w.add_lines(b'text0', [], list(map(addcrlf, base)))
967
 
        w.add_lines(b'text1', [b'text0'], list(map(addcrlf, a)))
968
 
        w.add_lines(b'text2', [b'text0'], list(map(addcrlf, b)))
 
881
        w.add_lines('text0', [], map(addcrlf, base))
 
882
        w.add_lines('text1', ['text0'], map(addcrlf, a))
 
883
        w.add_lines('text2', ['text0'], map(addcrlf, b))
969
884
 
970
885
        self.log_contents(w)
971
886
 
972
887
        self.log('merge plan:')
973
 
        p = list(w.plan_merge(b'text1', b'text2'))
 
888
        p = list(w.plan_merge('text1', 'text2'))
974
889
        for state, line in p:
975
890
            if line:
976
891
                self.log('%12s | %s' % (state, line[:-1]))
977
892
 
978
893
        self.log('merge:')
979
 
        mt = BytesIO()
 
894
        mt = StringIO()
980
895
        mt.writelines(w.weave_merge(p))
981
896
        mt.seek(0)
982
897
        self.log(mt.getvalue())
983
898
 
984
 
        mp = list(map(addcrlf, mp))
 
899
        mp = map(addcrlf, mp)
985
900
        self.assertEqual(mt.readlines(), mp)
986
 
 
 
901
        
 
902
        
987
903
    def testOneInsert(self):
988
904
        self.doMerge([],
989
 
                     [b'aa'],
 
905
                     ['aa'],
990
906
                     [],
991
 
                     [b'aa'])
 
907
                     ['aa'])
992
908
 
993
909
    def testSeparateInserts(self):
994
 
        self.doMerge([b'aaa', b'bbb', b'ccc'],
995
 
                     [b'aaa', b'xxx', b'bbb', b'ccc'],
996
 
                     [b'aaa', b'bbb', b'yyy', b'ccc'],
997
 
                     [b'aaa', b'xxx', b'bbb', b'yyy', b'ccc'])
 
910
        self.doMerge(['aaa', 'bbb', 'ccc'],
 
911
                     ['aaa', 'xxx', 'bbb', 'ccc'],
 
912
                     ['aaa', 'bbb', 'yyy', 'ccc'],
 
913
                     ['aaa', 'xxx', 'bbb', 'yyy', 'ccc'])
998
914
 
999
915
    def testSameInsert(self):
1000
 
        self.doMerge([b'aaa', b'bbb', b'ccc'],
1001
 
                     [b'aaa', b'xxx', b'bbb', b'ccc'],
1002
 
                     [b'aaa', b'xxx', b'bbb', b'yyy', b'ccc'],
1003
 
                     [b'aaa', b'xxx', b'bbb', b'yyy', b'ccc'])
1004
 
    overlappedInsertExpected = [b'aaa', b'xxx', b'yyy', b'bbb']
1005
 
 
 
916
        self.doMerge(['aaa', 'bbb', 'ccc'],
 
917
                     ['aaa', 'xxx', 'bbb', 'ccc'],
 
918
                     ['aaa', 'xxx', 'bbb', 'yyy', 'ccc'],
 
919
                     ['aaa', 'xxx', 'bbb', 'yyy', 'ccc'])
 
920
    overlappedInsertExpected = ['aaa', 'xxx', 'yyy', 'bbb']
1006
921
    def testOverlappedInsert(self):
1007
 
        self.doMerge([b'aaa', b'bbb'],
1008
 
                     [b'aaa', b'xxx', b'yyy', b'bbb'],
1009
 
                     [b'aaa', b'xxx', b'bbb'], self.overlappedInsertExpected)
1010
 
 
1011
 
        # really it ought to reduce this to
1012
 
        # [b'aaa', b'xxx', b'yyy', b'bbb']
 
922
        self.doMerge(['aaa', 'bbb'],
 
923
                     ['aaa', 'xxx', 'yyy', 'bbb'],
 
924
                     ['aaa', 'xxx', 'bbb'], self.overlappedInsertExpected)
 
925
 
 
926
        # really it ought to reduce this to 
 
927
        # ['aaa', 'xxx', 'yyy', 'bbb']
 
928
 
1013
929
 
1014
930
    def testClashReplace(self):
1015
 
        self.doMerge([b'aaa'],
1016
 
                     [b'xxx'],
1017
 
                     [b'yyy', b'zzz'],
1018
 
                     [b'<<<<<<< ', b'xxx', b'=======', b'yyy', b'zzz',
1019
 
                      b'>>>>>>> '])
 
931
        self.doMerge(['aaa'],
 
932
                     ['xxx'],
 
933
                     ['yyy', 'zzz'],
 
934
                     ['<<<<<<< ', 'xxx', '=======', 'yyy', 'zzz', 
 
935
                      '>>>>>>> '])
1020
936
 
1021
937
    def testNonClashInsert1(self):
1022
 
        self.doMerge([b'aaa'],
1023
 
                     [b'xxx', b'aaa'],
1024
 
                     [b'yyy', b'zzz'],
1025
 
                     [b'<<<<<<< ', b'xxx', b'aaa', b'=======', b'yyy', b'zzz',
1026
 
                      b'>>>>>>> '])
 
938
        self.doMerge(['aaa'],
 
939
                     ['xxx', 'aaa'],
 
940
                     ['yyy', 'zzz'],
 
941
                     ['<<<<<<< ', 'xxx', 'aaa', '=======', 'yyy', 'zzz', 
 
942
                      '>>>>>>> '])
1027
943
 
1028
944
    def testNonClashInsert2(self):
1029
 
        self.doMerge([b'aaa'],
1030
 
                     [b'aaa'],
1031
 
                     [b'yyy', b'zzz'],
1032
 
                     [b'yyy', b'zzz'])
 
945
        self.doMerge(['aaa'],
 
946
                     ['aaa'],
 
947
                     ['yyy', 'zzz'],
 
948
                     ['yyy', 'zzz'])
 
949
 
1033
950
 
1034
951
    def testDeleteAndModify(self):
1035
952
        """Clashing delete and modification.
1041
958
        #######################################
1042
959
        # skippd, not working yet
1043
960
        return
1044
 
 
1045
 
        self.doMerge([b'aaa', b'bbb', b'ccc'],
1046
 
                     [b'aaa', b'ddd', b'ccc'],
1047
 
                     [b'aaa', b'ccc'],
1048
 
                     [b'<<<<<<<< ', b'aaa', b'=======', b'>>>>>>> ', b'ccc'])
 
961
        
 
962
        self.doMerge(['aaa', 'bbb', 'ccc'],
 
963
                     ['aaa', 'ddd', 'ccc'],
 
964
                     ['aaa', 'ccc'],
 
965
                     ['<<<<<<<< ', 'aaa', '=======', '>>>>>>> ', 'ccc'])
1049
966
 
1050
967
    def _test_merge_from_strings(self, base, a, b, expected):
1051
968
        w = self.get_file()
1052
 
        w.add_lines(b'text0', [], base.splitlines(True))
1053
 
        w.add_lines(b'text1', [b'text0'], a.splitlines(True))
1054
 
        w.add_lines(b'text2', [b'text0'], b.splitlines(True))
 
969
        w.add_lines('text0', [], base.splitlines(True))
 
970
        w.add_lines('text1', ['text0'], a.splitlines(True))
 
971
        w.add_lines('text2', ['text0'], b.splitlines(True))
1055
972
        self.log('merge plan:')
1056
 
        p = list(w.plan_merge(b'text1', b'text2'))
 
973
        p = list(w.plan_merge('text1', 'text2'))
1057
974
        for state, line in p:
1058
975
            if line:
1059
976
                self.log('%12s | %s' % (state, line[:-1]))
1060
977
        self.log('merge result:')
1061
 
        result_text = b''.join(w.weave_merge(p))
 
978
        result_text = ''.join(w.weave_merge(p))
1062
979
        self.log(result_text)
1063
980
        self.assertEqualDiff(result_text, expected)
1064
981
 
1065
982
    def test_weave_merge_conflicts(self):
1066
983
        # does weave merge properly handle plans that end with unchanged?
1067
 
        result = b''.join(self.get_file().weave_merge([('new-a', b'hello\n')]))
1068
 
        self.assertEqual(result, b'hello\n')
 
984
        result = ''.join(self.get_file().weave_merge([('new-a', 'hello\n')]))
 
985
        self.assertEqual(result, 'hello\n')
1069
986
 
1070
987
    def test_deletion_extended(self):
1071
988
        """One side deletes, the other deletes more.
1072
989
        """
1073
 
        base = b"""\
 
990
        base = """\
1074
991
            line 1
1075
992
            line 2
1076
993
            line 3
1077
994
            """
1078
 
        a = b"""\
1079
 
            line 1
1080
 
            line 2
1081
 
            """
1082
 
        b = b"""\
1083
 
            line 1
1084
 
            """
1085
 
        result = b"""\
1086
 
            line 1
1087
 
<<<<<<<\x20
1088
 
            line 2
1089
 
=======
1090
 
>>>>>>>\x20
 
995
        a = """\
 
996
            line 1
 
997
            line 2
 
998
            """
 
999
        b = """\
 
1000
            line 1
 
1001
            """
 
1002
        result = """\
 
1003
            line 1
1091
1004
            """
1092
1005
        self._test_merge_from_strings(base, a, b, result)
1093
1006
 
1094
1007
    def test_deletion_overlap(self):
1095
1008
        """Delete overlapping regions with no other conflict.
1096
1009
 
1097
 
        Arguably it'd be better to treat these as agreement, rather than
 
1010
        Arguably it'd be better to treat these as agreement, rather than 
1098
1011
        conflict, but for now conflict is safer.
1099
1012
        """
1100
 
        base = b"""\
 
1013
        base = """\
1101
1014
            start context
1102
1015
            int a() {}
1103
1016
            int b() {}
1104
1017
            int c() {}
1105
1018
            end context
1106
1019
            """
1107
 
        a = b"""\
 
1020
        a = """\
1108
1021
            start context
1109
1022
            int a() {}
1110
1023
            end context
1111
1024
            """
1112
 
        b = b"""\
 
1025
        b = """\
1113
1026
            start context
1114
1027
            int c() {}
1115
1028
            end context
1116
1029
            """
1117
 
        result = b"""\
 
1030
        result = """\
1118
1031
            start context
1119
 
<<<<<<<\x20
 
1032
<<<<<<< 
1120
1033
            int a() {}
1121
1034
=======
1122
1035
            int c() {}
1123
 
>>>>>>>\x20
 
1036
>>>>>>> 
1124
1037
            end context
1125
1038
            """
1126
1039
        self._test_merge_from_strings(base, a, b, result)
1127
1040
 
1128
1041
    def test_agreement_deletion(self):
1129
1042
        """Agree to delete some lines, without conflicts."""
1130
 
        base = b"""\
 
1043
        base = """\
1131
1044
            start context
1132
1045
            base line 1
1133
1046
            base line 2
1134
1047
            end context
1135
1048
            """
1136
 
        a = b"""\
1137
 
            start context
1138
 
            base line 1
1139
 
            end context
1140
 
            """
1141
 
        b = b"""\
1142
 
            start context
1143
 
            base line 1
1144
 
            end context
1145
 
            """
1146
 
        result = b"""\
 
1049
        a = """\
 
1050
            start context
 
1051
            base line 1
 
1052
            end context
 
1053
            """
 
1054
        b = """\
 
1055
            start context
 
1056
            base line 1
 
1057
            end context
 
1058
            """
 
1059
        result = """\
1147
1060
            start context
1148
1061
            base line 1
1149
1062
            end context
1152
1065
 
1153
1066
    def test_sync_on_deletion(self):
1154
1067
        """Specific case of merge where we can synchronize incorrectly.
1155
 
 
 
1068
        
1156
1069
        A previous version of the weave merge concluded that the two versions
1157
1070
        agreed on deleting line 2, and this could be a synchronization point.
1158
 
        Line 1 was then considered in isolation, and thought to be deleted on
 
1071
        Line 1 was then considered in isolation, and thought to be deleted on 
1159
1072
        both sides.
1160
1073
 
1161
1074
        It's better to consider the whole thing as a disagreement region.
1162
1075
        """
1163
 
        base = b"""\
 
1076
        base = """\
1164
1077
            start context
1165
1078
            base line 1
1166
1079
            base line 2
1167
1080
            end context
1168
1081
            """
1169
 
        a = b"""\
 
1082
        a = """\
1170
1083
            start context
1171
1084
            base line 1
1172
1085
            a's replacement line 2
1173
1086
            end context
1174
1087
            """
1175
 
        b = b"""\
 
1088
        b = """\
1176
1089
            start context
1177
1090
            b replaces
1178
1091
            both lines
1179
1092
            end context
1180
1093
            """
1181
 
        result = b"""\
 
1094
        result = """\
1182
1095
            start context
1183
 
<<<<<<<\x20
 
1096
<<<<<<< 
1184
1097
            base line 1
1185
1098
            a's replacement line 2
1186
1099
=======
1187
1100
            b replaces
1188
1101
            both lines
1189
 
>>>>>>>\x20
 
1102
>>>>>>> 
1190
1103
            end context
1191
1104
            """
1192
1105
        self._test_merge_from_strings(base, a, b, result)
1193
1106
 
1194
1107
 
1195
 
class TestWeaveMerge(TestCaseWithMemoryTransport, MergeCasesMixin):
1196
 
 
1197
 
    def get_file(self, name='foo'):
1198
 
        return WeaveFile(name, self.get_transport(),
1199
 
                         create=True)
 
1108
class TestKnitMerge(TestCaseWithTransport, MergeCasesMixin):
 
1109
 
 
1110
    def get_file(self, name='foo'):
 
1111
        return KnitVersionedFile(name, get_transport(self.get_url('.')),
 
1112
                                 delta=True, create=True)
 
1113
 
 
1114
    def log_contents(self, w):
 
1115
        pass
 
1116
 
 
1117
 
 
1118
class TestWeaveMerge(TestCaseWithTransport, MergeCasesMixin):
 
1119
 
 
1120
    def get_file(self, name='foo'):
 
1121
        return WeaveFile(name, get_transport(self.get_url('.')), create=True)
1200
1122
 
1201
1123
    def log_contents(self, w):
1202
1124
        self.log('weave is:')
1203
 
        tmpf = BytesIO()
 
1125
        tmpf = StringIO()
1204
1126
        write_weave(w, tmpf)
1205
1127
        self.log(tmpf.getvalue())
1206
1128
 
1207
 
    overlappedInsertExpected = [b'aaa', b'<<<<<<< ', b'xxx', b'yyy', b'=======',
1208
 
                                b'xxx', b'>>>>>>> ', b'bbb']
1209
 
 
1210
 
 
1211
 
class TestContentFactoryAdaption(TestCaseWithMemoryTransport):
1212
 
 
1213
 
    def test_select_adaptor(self):
1214
 
        """Test expected adapters exist."""
1215
 
        # One scenario for each lookup combination we expect to use.
1216
 
        # Each is source_kind, requested_kind, adapter class
1217
 
        scenarios = [
1218
 
            ('knit-delta-gz', 'fulltext', _mod_knit.DeltaPlainToFullText),
1219
 
            ('knit-delta-gz', 'lines', _mod_knit.DeltaPlainToFullText),
1220
 
            ('knit-delta-gz', 'chunked', _mod_knit.DeltaPlainToFullText),
1221
 
            ('knit-ft-gz', 'fulltext', _mod_knit.FTPlainToFullText),
1222
 
            ('knit-ft-gz', 'lines', _mod_knit.FTPlainToFullText),
1223
 
            ('knit-ft-gz', 'chunked', _mod_knit.FTPlainToFullText),
1224
 
            ('knit-annotated-delta-gz', 'knit-delta-gz',
1225
 
                _mod_knit.DeltaAnnotatedToUnannotated),
1226
 
            ('knit-annotated-delta-gz', 'fulltext',
1227
 
                _mod_knit.DeltaAnnotatedToFullText),
1228
 
            ('knit-annotated-ft-gz', 'knit-ft-gz',
1229
 
                _mod_knit.FTAnnotatedToUnannotated),
1230
 
            ('knit-annotated-ft-gz', 'fulltext',
1231
 
                _mod_knit.FTAnnotatedToFullText),
1232
 
            ('knit-annotated-ft-gz', 'lines',
1233
 
                _mod_knit.FTAnnotatedToFullText),
1234
 
            ('knit-annotated-ft-gz', 'chunked',
1235
 
                _mod_knit.FTAnnotatedToFullText),
1236
 
            ]
1237
 
        for source, requested, klass in scenarios:
1238
 
            adapter_factory = versionedfile.adapter_registry.get(
1239
 
                (source, requested))
1240
 
            adapter = adapter_factory(None)
1241
 
            self.assertIsInstance(adapter, klass)
1242
 
 
1243
 
    def get_knit(self, annotated=True):
1244
 
        mapper = ConstantMapper('knit')
1245
 
        transport = self.get_transport()
1246
 
        return make_file_factory(annotated, mapper)(transport)
1247
 
 
1248
 
    def helpGetBytes(self, f, ft_name, ft_adapter, delta_name, delta_adapter):
1249
 
        """Grab the interested adapted texts for tests."""
1250
 
        # origin is a fulltext
1251
 
        entries = f.get_record_stream([(b'origin',)], 'unordered', False)
1252
 
        base = next(entries)
1253
 
        ft_data = ft_adapter.get_bytes(base, ft_name)
1254
 
        # merged is both a delta and multiple parents.
1255
 
        entries = f.get_record_stream([(b'merged',)], 'unordered', False)
1256
 
        merged = next(entries)
1257
 
        delta_data = delta_adapter.get_bytes(merged, delta_name)
1258
 
        return ft_data, delta_data
1259
 
 
1260
 
    def test_deannotation_noeol(self):
1261
 
        """Test converting annotated knits to unannotated knits."""
1262
 
        # we need a full text, and a delta
1263
 
        f = self.get_knit()
1264
 
        get_diamond_files(f, 1, trailing_eol=False)
1265
 
        ft_data, delta_data = self.helpGetBytes(
1266
 
            f, 'knit-ft-gz', _mod_knit.FTAnnotatedToUnannotated(None),
1267
 
            'knit-delta-gz', _mod_knit.DeltaAnnotatedToUnannotated(None))
1268
 
        self.assertEqual(
1269
 
            b'version origin 1 b284f94827db1fa2970d9e2014f080413b547a7e\n'
1270
 
            b'origin\n'
1271
 
            b'end origin\n',
1272
 
            GzipFile(mode='rb', fileobj=BytesIO(ft_data)).read())
1273
 
        self.assertEqual(
1274
 
            b'version merged 4 32c2e79763b3f90e8ccde37f9710b6629c25a796\n'
1275
 
            b'1,2,3\nleft\nright\nmerged\nend merged\n',
1276
 
            GzipFile(mode='rb', fileobj=BytesIO(delta_data)).read())
1277
 
 
1278
 
    def test_deannotation(self):
1279
 
        """Test converting annotated knits to unannotated knits."""
1280
 
        # we need a full text, and a delta
1281
 
        f = self.get_knit()
1282
 
        get_diamond_files(f, 1)
1283
 
        ft_data, delta_data = self.helpGetBytes(
1284
 
            f, 'knit-ft-gz', _mod_knit.FTAnnotatedToUnannotated(None),
1285
 
            'knit-delta-gz', _mod_knit.DeltaAnnotatedToUnannotated(None))
1286
 
        self.assertEqual(
1287
 
            b'version origin 1 00e364d235126be43292ab09cb4686cf703ddc17\n'
1288
 
            b'origin\n'
1289
 
            b'end origin\n',
1290
 
            GzipFile(mode='rb', fileobj=BytesIO(ft_data)).read())
1291
 
        self.assertEqual(
1292
 
            b'version merged 3 ed8bce375198ea62444dc71952b22cfc2b09226d\n'
1293
 
            b'2,2,2\nright\nmerged\nend merged\n',
1294
 
            GzipFile(mode='rb', fileobj=BytesIO(delta_data)).read())
1295
 
 
1296
 
    def test_annotated_to_fulltext_no_eol(self):
1297
 
        """Test adapting annotated knits to full texts (for -> weaves)."""
1298
 
        # we need a full text, and a delta
1299
 
        f = self.get_knit()
1300
 
        get_diamond_files(f, 1, trailing_eol=False)
1301
 
        # Reconstructing a full text requires a backing versioned file, and it
1302
 
        # must have the base lines requested from it.
1303
 
        logged_vf = versionedfile.RecordingVersionedFilesDecorator(f)
1304
 
        ft_data, delta_data = self.helpGetBytes(
1305
 
            f, 'fulltext', _mod_knit.FTAnnotatedToFullText(None),
1306
 
            'fulltext', _mod_knit.DeltaAnnotatedToFullText(logged_vf))
1307
 
        self.assertEqual(b'origin', ft_data)
1308
 
        self.assertEqual(b'base\nleft\nright\nmerged', delta_data)
1309
 
        self.assertEqual([('get_record_stream', [(b'left',)], 'unordered',
1310
 
                           True)], logged_vf.calls)
1311
 
 
1312
 
    def test_annotated_to_fulltext(self):
1313
 
        """Test adapting annotated knits to full texts (for -> weaves)."""
1314
 
        # we need a full text, and a delta
1315
 
        f = self.get_knit()
1316
 
        get_diamond_files(f, 1)
1317
 
        # Reconstructing a full text requires a backing versioned file, and it
1318
 
        # must have the base lines requested from it.
1319
 
        logged_vf = versionedfile.RecordingVersionedFilesDecorator(f)
1320
 
        ft_data, delta_data = self.helpGetBytes(
1321
 
            f, 'fulltext', _mod_knit.FTAnnotatedToFullText(None),
1322
 
            'fulltext', _mod_knit.DeltaAnnotatedToFullText(logged_vf))
1323
 
        self.assertEqual(b'origin\n', ft_data)
1324
 
        self.assertEqual(b'base\nleft\nright\nmerged\n', delta_data)
1325
 
        self.assertEqual([('get_record_stream', [(b'left',)], 'unordered',
1326
 
                           True)], logged_vf.calls)
1327
 
 
1328
 
    def test_unannotated_to_fulltext(self):
1329
 
        """Test adapting unannotated knits to full texts.
1330
 
 
1331
 
        This is used for -> weaves, and for -> annotated knits.
1332
 
        """
1333
 
        # we need a full text, and a delta
1334
 
        f = self.get_knit(annotated=False)
1335
 
        get_diamond_files(f, 1)
1336
 
        # Reconstructing a full text requires a backing versioned file, and it
1337
 
        # must have the base lines requested from it.
1338
 
        logged_vf = versionedfile.RecordingVersionedFilesDecorator(f)
1339
 
        ft_data, delta_data = self.helpGetBytes(
1340
 
            f, 'fulltext', _mod_knit.FTPlainToFullText(None),
1341
 
            'fulltext', _mod_knit.DeltaPlainToFullText(logged_vf))
1342
 
        self.assertEqual(b'origin\n', ft_data)
1343
 
        self.assertEqual(b'base\nleft\nright\nmerged\n', delta_data)
1344
 
        self.assertEqual([('get_record_stream', [(b'left',)], 'unordered',
1345
 
                           True)], logged_vf.calls)
1346
 
 
1347
 
    def test_unannotated_to_fulltext_no_eol(self):
1348
 
        """Test adapting unannotated knits to full texts.
1349
 
 
1350
 
        This is used for -> weaves, and for -> annotated knits.
1351
 
        """
1352
 
        # we need a full text, and a delta
1353
 
        f = self.get_knit(annotated=False)
1354
 
        get_diamond_files(f, 1, trailing_eol=False)
1355
 
        # Reconstructing a full text requires a backing versioned file, and it
1356
 
        # must have the base lines requested from it.
1357
 
        logged_vf = versionedfile.RecordingVersionedFilesDecorator(f)
1358
 
        ft_data, delta_data = self.helpGetBytes(
1359
 
            f, 'fulltext', _mod_knit.FTPlainToFullText(None),
1360
 
            'fulltext', _mod_knit.DeltaPlainToFullText(logged_vf))
1361
 
        self.assertEqual(b'origin', ft_data)
1362
 
        self.assertEqual(b'base\nleft\nright\nmerged', delta_data)
1363
 
        self.assertEqual([('get_record_stream', [(b'left',)], 'unordered',
1364
 
                           True)], logged_vf.calls)
1365
 
 
1366
 
 
1367
 
class TestKeyMapper(TestCaseWithMemoryTransport):
1368
 
    """Tests for various key mapping logic."""
1369
 
 
1370
 
    def test_identity_mapper(self):
1371
 
        mapper = versionedfile.ConstantMapper("inventory")
1372
 
        self.assertEqual("inventory", mapper.map((b'foo@ar',)))
1373
 
        self.assertEqual("inventory", mapper.map((b'quux',)))
1374
 
 
1375
 
    def test_prefix_mapper(self):
1376
 
        #format5: plain
1377
 
        mapper = versionedfile.PrefixMapper()
1378
 
        self.assertEqual("file-id", mapper.map((b"file-id", b"revision-id")))
1379
 
        self.assertEqual("new-id", mapper.map((b"new-id", b"revision-id")))
1380
 
        self.assertEqual((b'file-id',), mapper.unmap("file-id"))
1381
 
        self.assertEqual((b'new-id',), mapper.unmap("new-id"))
1382
 
 
1383
 
    def test_hash_prefix_mapper(self):
1384
 
        #format6: hash + plain
1385
 
        mapper = versionedfile.HashPrefixMapper()
1386
 
        self.assertEqual(
1387
 
            "9b/file-id", mapper.map((b"file-id", b"revision-id")))
1388
 
        self.assertEqual("45/new-id", mapper.map((b"new-id", b"revision-id")))
1389
 
        self.assertEqual((b'file-id',), mapper.unmap("9b/file-id"))
1390
 
        self.assertEqual((b'new-id',), mapper.unmap("45/new-id"))
1391
 
 
1392
 
    def test_hash_escaped_mapper(self):
1393
 
        #knit1: hash + escaped
1394
 
        mapper = versionedfile.HashEscapedPrefixMapper()
1395
 
        self.assertEqual("88/%2520", mapper.map((b" ", b"revision-id")))
1396
 
        self.assertEqual("ed/fil%2545-%2549d", mapper.map((b"filE-Id",
1397
 
                                                           b"revision-id")))
1398
 
        self.assertEqual("88/ne%2557-%2549d", mapper.map((b"neW-Id",
1399
 
                                                          b"revision-id")))
1400
 
        self.assertEqual((b'filE-Id',), mapper.unmap("ed/fil%2545-%2549d"))
1401
 
        self.assertEqual((b'neW-Id',), mapper.unmap("88/ne%2557-%2549d"))
1402
 
 
1403
 
 
1404
 
class TestVersionedFiles(TestCaseWithMemoryTransport):
1405
 
    """Tests for the multiple-file variant of VersionedFile."""
1406
 
 
1407
 
    # We want to be sure of behaviour for:
1408
 
    # weaves prefix layout (weave texts)
1409
 
    # individually named weaves (weave inventories)
1410
 
    # annotated knits - prefix|hash|hash-escape layout, we test the third only
1411
 
    #                   as it is the most complex mapper.
1412
 
    # individually named knits
1413
 
    # individual no-graph knits in packs (signatures)
1414
 
    # individual graph knits in packs (inventories)
1415
 
    # individual graph nocompression knits in packs (revisions)
1416
 
    # plain text knits in packs (texts)
1417
 
    len_one_scenarios = [
1418
 
        ('weave-named', {
1419
 
            'cleanup': None,
1420
 
            'factory': make_versioned_files_factory(WeaveFile,
1421
 
                                                    ConstantMapper('inventory')),
1422
 
            'graph': True,
1423
 
            'key_length': 1,
1424
 
            'support_partial_insertion': False,
1425
 
            }),
1426
 
        ('named-knit', {
1427
 
            'cleanup': None,
1428
 
            'factory': make_file_factory(False, ConstantMapper('revisions')),
1429
 
            'graph': True,
1430
 
            'key_length': 1,
1431
 
            'support_partial_insertion': False,
1432
 
            }),
1433
 
        ('named-nograph-nodelta-knit-pack', {
1434
 
            'cleanup': cleanup_pack_knit,
1435
 
            'factory': make_pack_factory(False, False, 1),
1436
 
            'graph': False,
1437
 
            'key_length': 1,
1438
 
            'support_partial_insertion': False,
1439
 
            }),
1440
 
        ('named-graph-knit-pack', {
1441
 
            'cleanup': cleanup_pack_knit,
1442
 
            'factory': make_pack_factory(True, True, 1),
1443
 
            'graph': True,
1444
 
            'key_length': 1,
1445
 
            'support_partial_insertion': True,
1446
 
            }),
1447
 
        ('named-graph-nodelta-knit-pack', {
1448
 
            'cleanup': cleanup_pack_knit,
1449
 
            'factory': make_pack_factory(True, False, 1),
1450
 
            'graph': True,
1451
 
            'key_length': 1,
1452
 
            'support_partial_insertion': False,
1453
 
            }),
1454
 
        ('groupcompress-nograph', {
1455
 
            'cleanup': groupcompress.cleanup_pack_group,
1456
 
            'factory': groupcompress.make_pack_factory(False, False, 1),
1457
 
            'graph': False,
1458
 
            'key_length': 1,
1459
 
            'support_partial_insertion': False,
1460
 
            }),
1461
 
        ]
1462
 
    len_two_scenarios = [
1463
 
        ('weave-prefix', {
1464
 
            'cleanup': None,
1465
 
            'factory': make_versioned_files_factory(WeaveFile,
1466
 
                                                    PrefixMapper()),
1467
 
            'graph': True,
1468
 
            'key_length': 2,
1469
 
            'support_partial_insertion': False,
1470
 
            }),
1471
 
        ('annotated-knit-escape', {
1472
 
            'cleanup': None,
1473
 
            'factory': make_file_factory(True, HashEscapedPrefixMapper()),
1474
 
            'graph': True,
1475
 
            'key_length': 2,
1476
 
            'support_partial_insertion': False,
1477
 
            }),
1478
 
        ('plain-knit-pack', {
1479
 
            'cleanup': cleanup_pack_knit,
1480
 
            'factory': make_pack_factory(True, True, 2),
1481
 
            'graph': True,
1482
 
            'key_length': 2,
1483
 
            'support_partial_insertion': True,
1484
 
            }),
1485
 
        ('groupcompress', {
1486
 
            'cleanup': groupcompress.cleanup_pack_group,
1487
 
            'factory': groupcompress.make_pack_factory(True, False, 1),
1488
 
            'graph': True,
1489
 
            'key_length': 1,
1490
 
            'support_partial_insertion': False,
1491
 
            }),
1492
 
        ]
1493
 
 
1494
 
    scenarios = len_one_scenarios + len_two_scenarios
1495
 
 
1496
 
    def get_versionedfiles(self, relpath='files'):
1497
 
        transport = self.get_transport(relpath)
1498
 
        if relpath != '.':
1499
 
            transport.mkdir('.')
1500
 
        files = self.factory(transport)
1501
 
        if self.cleanup is not None:
1502
 
            self.addCleanup(self.cleanup, files)
1503
 
        return files
1504
 
 
1505
 
    def get_simple_key(self, suffix):
1506
 
        """Return a key for the object under test."""
1507
 
        if self.key_length == 1:
1508
 
            return (suffix,)
1509
 
        else:
1510
 
            return (b'FileA',) + (suffix,)
1511
 
 
1512
 
    def test_add_fallback_implies_without_fallbacks(self):
1513
 
        f = self.get_versionedfiles('files')
1514
 
        if getattr(f, 'add_fallback_versioned_files', None) is None:
1515
 
            raise TestNotApplicable("%s doesn't support fallbacks"
1516
 
                                    % (f.__class__.__name__,))
1517
 
        g = self.get_versionedfiles('fallback')
1518
 
        key_a = self.get_simple_key(b'a')
1519
 
        g.add_lines(key_a, [], [b'\n'])
1520
 
        f.add_fallback_versioned_files(g)
1521
 
        self.assertTrue(key_a in f.get_parent_map([key_a]))
1522
 
        self.assertFalse(
1523
 
            key_a in f.without_fallbacks().get_parent_map([key_a]))
1524
 
 
1525
 
    def test_add_lines(self):
1526
 
        f = self.get_versionedfiles()
1527
 
        key0 = self.get_simple_key(b'r0')
1528
 
        key1 = self.get_simple_key(b'r1')
1529
 
        key2 = self.get_simple_key(b'r2')
1530
 
        keyf = self.get_simple_key(b'foo')
1531
 
        f.add_lines(key0, [], [b'a\n', b'b\n'])
1532
 
        if self.graph:
1533
 
            f.add_lines(key1, [key0], [b'b\n', b'c\n'])
1534
 
        else:
1535
 
            f.add_lines(key1, [], [b'b\n', b'c\n'])
1536
 
        keys = f.keys()
1537
 
        self.assertTrue(key0 in keys)
1538
 
        self.assertTrue(key1 in keys)
1539
 
        records = []
1540
 
        for record in f.get_record_stream([key0, key1], 'unordered', True):
1541
 
            records.append((record.key, record.get_bytes_as('fulltext')))
1542
 
        records.sort()
1543
 
        self.assertEqual([(key0, b'a\nb\n'), (key1, b'b\nc\n')], records)
1544
 
 
1545
 
    def test_add_chunks(self):
1546
 
        f = self.get_versionedfiles()
1547
 
        key0 = self.get_simple_key(b'r0')
1548
 
        key1 = self.get_simple_key(b'r1')
1549
 
        key2 = self.get_simple_key(b'r2')
1550
 
        keyf = self.get_simple_key(b'foo')
1551
 
        def add_chunks(key, parents, chunks):
1552
 
            factory = ChunkedContentFactory(
1553
 
                key, parents, osutils.sha_strings(chunks), chunks)
1554
 
            return f.add_content(factory)
1555
 
 
1556
 
        add_chunks(key0, [], [b'a', b'\nb\n'])
1557
 
        if self.graph:
1558
 
            add_chunks(key1, [key0], [b'b', b'\n', b'c\n'])
1559
 
        else:
1560
 
            add_chunks(key1, [], [b'b\n', b'c\n'])
1561
 
        keys = f.keys()
1562
 
        self.assertIn(key0, keys)
1563
 
        self.assertIn(key1, keys)
1564
 
        records = []
1565
 
        for record in f.get_record_stream([key0, key1], 'unordered', True):
1566
 
            records.append((record.key, record.get_bytes_as('fulltext')))
1567
 
        records.sort()
1568
 
        self.assertEqual([(key0, b'a\nb\n'), (key1, b'b\nc\n')], records)
1569
 
 
1570
 
    def test_annotate(self):
1571
 
        files = self.get_versionedfiles()
1572
 
        self.get_diamond_files(files)
1573
 
        if self.key_length == 1:
1574
 
            prefix = ()
1575
 
        else:
1576
 
            prefix = (b'FileA',)
1577
 
        # introduced full text
1578
 
        origins = files.annotate(prefix + (b'origin',))
1579
 
        self.assertEqual([
1580
 
            (prefix + (b'origin',), b'origin\n')],
1581
 
            origins)
1582
 
        # a delta
1583
 
        origins = files.annotate(prefix + (b'base',))
1584
 
        self.assertEqual([
1585
 
            (prefix + (b'base',), b'base\n')],
1586
 
            origins)
1587
 
        # a merge
1588
 
        origins = files.annotate(prefix + (b'merged',))
1589
 
        if self.graph:
1590
 
            self.assertEqual([
1591
 
                (prefix + (b'base',), b'base\n'),
1592
 
                (prefix + (b'left',), b'left\n'),
1593
 
                (prefix + (b'right',), b'right\n'),
1594
 
                (prefix + (b'merged',), b'merged\n')
1595
 
                ],
1596
 
                origins)
1597
 
        else:
1598
 
            # Without a graph everything is new.
1599
 
            self.assertEqual([
1600
 
                (prefix + (b'merged',), b'base\n'),
1601
 
                (prefix + (b'merged',), b'left\n'),
1602
 
                (prefix + (b'merged',), b'right\n'),
1603
 
                (prefix + (b'merged',), b'merged\n')
1604
 
                ],
1605
 
                origins)
1606
 
        self.assertRaises(RevisionNotPresent,
1607
 
                          files.annotate, prefix + ('missing-key',))
1608
 
 
1609
 
    def test_check_no_parameters(self):
1610
 
        files = self.get_versionedfiles()
1611
 
 
1612
 
    def test_check_progressbar_parameter(self):
1613
 
        """A progress bar can be supplied because check can be a generator."""
1614
 
        pb = ui.ui_factory.nested_progress_bar()
1615
 
        self.addCleanup(pb.finished)
1616
 
        files = self.get_versionedfiles()
1617
 
        files.check(progress_bar=pb)
1618
 
 
1619
 
    def test_check_with_keys_becomes_generator(self):
1620
 
        files = self.get_versionedfiles()
1621
 
        self.get_diamond_files(files)
1622
 
        keys = files.keys()
1623
 
        entries = files.check(keys=keys)
1624
 
        seen = set()
1625
 
        # Texts output should be fulltexts.
1626
 
        self.capture_stream(files, entries, seen.add,
1627
 
                            files.get_parent_map(keys), require_fulltext=True)
1628
 
        # All texts should be output.
1629
 
        self.assertEqual(set(keys), seen)
1630
 
 
1631
 
    def test_clear_cache(self):
1632
 
        files = self.get_versionedfiles()
1633
 
        files.clear_cache()
1634
 
 
1635
 
    def test_construct(self):
1636
 
        """Each parameterised test can be constructed on a transport."""
1637
 
        files = self.get_versionedfiles()
1638
 
 
1639
 
    def get_diamond_files(self, files, trailing_eol=True, left_only=False,
1640
 
                          nokeys=False):
1641
 
        return get_diamond_files(files, self.key_length,
1642
 
                                 trailing_eol=trailing_eol, nograph=not self.graph,
1643
 
                                 left_only=left_only, nokeys=nokeys)
1644
 
 
1645
 
    def _add_content_nostoresha(self, add_lines):
1646
 
        """When nostore_sha is supplied using old content raises."""
1647
 
        vf = self.get_versionedfiles()
1648
 
        empty_text = (b'a', [])
1649
 
        sample_text_nl = (b'b', [b"foo\n", b"bar\n"])
1650
 
        sample_text_no_nl = (b'c', [b"foo\n", b"bar"])
1651
 
        shas = []
1652
 
        for version, lines in (empty_text, sample_text_nl, sample_text_no_nl):
1653
 
            if add_lines:
1654
 
                sha, _, _ = vf.add_lines(self.get_simple_key(version), [],
1655
 
                                         lines)
1656
 
            else:
1657
 
                sha, _, _ = vf.add_lines(self.get_simple_key(version), [],
1658
 
                                         lines)
1659
 
            shas.append(sha)
1660
 
        # we now have a copy of all the lines in the vf.
1661
 
        for sha, (version, lines) in zip(
1662
 
                shas, (empty_text, sample_text_nl, sample_text_no_nl)):
1663
 
            new_key = self.get_simple_key(version + b"2")
1664
 
            self.assertRaises(errors.ExistingContent,
1665
 
                              vf.add_lines, new_key, [], lines,
1666
 
                              nostore_sha=sha)
1667
 
            self.assertRaises(errors.ExistingContent,
1668
 
                              vf.add_lines, new_key, [], lines,
1669
 
                              nostore_sha=sha)
1670
 
            # and no new version should have been added.
1671
 
            record = next(vf.get_record_stream([new_key], 'unordered', True))
1672
 
            self.assertEqual('absent', record.storage_kind)
1673
 
 
1674
 
    def test_add_lines_nostoresha(self):
1675
 
        self._add_content_nostoresha(add_lines=True)
1676
 
 
1677
 
    def test_add_lines_return(self):
1678
 
        files = self.get_versionedfiles()
1679
 
        # save code by using the stock data insertion helper.
1680
 
        adds = self.get_diamond_files(files)
1681
 
        results = []
1682
 
        # We can only validate the first 2 elements returned from add_lines.
1683
 
        for add in adds:
1684
 
            self.assertEqual(3, len(add))
1685
 
            results.append(add[:2])
1686
 
        if self.key_length == 1:
1687
 
            self.assertEqual([
1688
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1689
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1690
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1691
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1692
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23)],
1693
 
                results)
1694
 
        elif self.key_length == 2:
1695
 
            self.assertEqual([
1696
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1697
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1698
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1699
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1700
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1701
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1702
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1703
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1704
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23),
1705
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23)],
1706
 
                results)
1707
 
 
1708
 
    def test_add_lines_no_key_generates_chk_key(self):
1709
 
        files = self.get_versionedfiles()
1710
 
        # save code by using the stock data insertion helper.
1711
 
        adds = self.get_diamond_files(files, nokeys=True)
1712
 
        results = []
1713
 
        # We can only validate the first 2 elements returned from add_lines.
1714
 
        for add in adds:
1715
 
            self.assertEqual(3, len(add))
1716
 
            results.append(add[:2])
1717
 
        if self.key_length == 1:
1718
 
            self.assertEqual([
1719
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1720
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1721
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1722
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1723
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23)],
1724
 
                results)
1725
 
            # Check the added items got CHK keys.
1726
 
            self.assertEqual({
1727
 
                (b'sha1:00e364d235126be43292ab09cb4686cf703ddc17',),
1728
 
                (b'sha1:51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44',),
1729
 
                (b'sha1:9ef09dfa9d86780bdec9219a22560c6ece8e0ef1',),
1730
 
                (b'sha1:a8478686da38e370e32e42e8a0c220e33ee9132f',),
1731
 
                (b'sha1:ed8bce375198ea62444dc71952b22cfc2b09226d',),
1732
 
                },
1733
 
                files.keys())
1734
 
        elif self.key_length == 2:
1735
 
            self.assertEqual([
1736
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1737
 
                (b'00e364d235126be43292ab09cb4686cf703ddc17', 7),
1738
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1739
 
                (b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44', 5),
1740
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1741
 
                (b'a8478686da38e370e32e42e8a0c220e33ee9132f', 10),
1742
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1743
 
                (b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1', 11),
1744
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23),
1745
 
                (b'ed8bce375198ea62444dc71952b22cfc2b09226d', 23)],
1746
 
                results)
1747
 
            # Check the added items got CHK keys.
1748
 
            self.assertEqual({
1749
 
                (b'FileA', b'sha1:00e364d235126be43292ab09cb4686cf703ddc17'),
1750
 
                (b'FileA', b'sha1:51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44'),
1751
 
                (b'FileA', b'sha1:9ef09dfa9d86780bdec9219a22560c6ece8e0ef1'),
1752
 
                (b'FileA', b'sha1:a8478686da38e370e32e42e8a0c220e33ee9132f'),
1753
 
                (b'FileA', b'sha1:ed8bce375198ea62444dc71952b22cfc2b09226d'),
1754
 
                (b'FileB', b'sha1:00e364d235126be43292ab09cb4686cf703ddc17'),
1755
 
                (b'FileB', b'sha1:51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44'),
1756
 
                (b'FileB', b'sha1:9ef09dfa9d86780bdec9219a22560c6ece8e0ef1'),
1757
 
                (b'FileB', b'sha1:a8478686da38e370e32e42e8a0c220e33ee9132f'),
1758
 
                (b'FileB', b'sha1:ed8bce375198ea62444dc71952b22cfc2b09226d'),
1759
 
                },
1760
 
                files.keys())
1761
 
 
1762
 
    def test_empty_lines(self):
1763
 
        """Empty files can be stored."""
1764
 
        f = self.get_versionedfiles()
1765
 
        key_a = self.get_simple_key(b'a')
1766
 
        f.add_lines(key_a, [], [])
1767
 
        self.assertEqual(b'',
1768
 
                         next(f.get_record_stream([key_a], 'unordered', True
1769
 
                                                  )).get_bytes_as('fulltext'))
1770
 
        key_b = self.get_simple_key(b'b')
1771
 
        f.add_lines(key_b, self.get_parents([key_a]), [])
1772
 
        self.assertEqual(b'',
1773
 
                         next(f.get_record_stream([key_b], 'unordered', True
1774
 
                                                  )).get_bytes_as('fulltext'))
1775
 
 
1776
 
    def test_newline_only(self):
1777
 
        f = self.get_versionedfiles()
1778
 
        key_a = self.get_simple_key(b'a')
1779
 
        f.add_lines(key_a, [], [b'\n'])
1780
 
        self.assertEqual(b'\n',
1781
 
                         next(f.get_record_stream([key_a], 'unordered', True
1782
 
                                                  )).get_bytes_as('fulltext'))
1783
 
        key_b = self.get_simple_key(b'b')
1784
 
        f.add_lines(key_b, self.get_parents([key_a]), [b'\n'])
1785
 
        self.assertEqual(b'\n',
1786
 
                         next(f.get_record_stream([key_b], 'unordered', True
1787
 
                                                  )).get_bytes_as('fulltext'))
1788
 
 
1789
 
    def test_get_known_graph_ancestry(self):
1790
 
        f = self.get_versionedfiles()
1791
 
        if not self.graph:
1792
 
            raise TestNotApplicable('ancestry info only relevant with graph.')
1793
 
        key_a = self.get_simple_key(b'a')
1794
 
        key_b = self.get_simple_key(b'b')
1795
 
        key_c = self.get_simple_key(b'c')
1796
 
        # A
1797
 
        # |\
1798
 
        # | B
1799
 
        # |/
1800
 
        # C
1801
 
        f.add_lines(key_a, [], [b'\n'])
1802
 
        f.add_lines(key_b, [key_a], [b'\n'])
1803
 
        f.add_lines(key_c, [key_a, key_b], [b'\n'])
1804
 
        kg = f.get_known_graph_ancestry([key_c])
1805
 
        self.assertIsInstance(kg, _mod_graph.KnownGraph)
1806
 
        self.assertEqual([key_a, key_b, key_c], list(kg.topo_sort()))
1807
 
 
1808
 
    def test_known_graph_with_fallbacks(self):
1809
 
        f = self.get_versionedfiles('files')
1810
 
        if not self.graph:
1811
 
            raise TestNotApplicable('ancestry info only relevant with graph.')
1812
 
        if getattr(f, 'add_fallback_versioned_files', None) is None:
1813
 
            raise TestNotApplicable("%s doesn't support fallbacks"
1814
 
                                    % (f.__class__.__name__,))
1815
 
        key_a = self.get_simple_key(b'a')
1816
 
        key_b = self.get_simple_key(b'b')
1817
 
        key_c = self.get_simple_key(b'c')
1818
 
        # A     only in fallback
1819
 
        # |\
1820
 
        # | B
1821
 
        # |/
1822
 
        # C
1823
 
        g = self.get_versionedfiles('fallback')
1824
 
        g.add_lines(key_a, [], [b'\n'])
1825
 
        f.add_fallback_versioned_files(g)
1826
 
        f.add_lines(key_b, [key_a], [b'\n'])
1827
 
        f.add_lines(key_c, [key_a, key_b], [b'\n'])
1828
 
        kg = f.get_known_graph_ancestry([key_c])
1829
 
        self.assertEqual([key_a, key_b, key_c], list(kg.topo_sort()))
1830
 
 
1831
 
    def test_get_record_stream_empty(self):
1832
 
        """An empty stream can be requested without error."""
1833
 
        f = self.get_versionedfiles()
1834
 
        entries = f.get_record_stream([], 'unordered', False)
1835
 
        self.assertEqual([], list(entries))
1836
 
 
1837
 
    def assertValidStorageKind(self, storage_kind):
1838
 
        """Assert that storage_kind is a valid storage_kind."""
1839
 
        self.assertSubset([storage_kind],
1840
 
                          ['mpdiff', 'knit-annotated-ft', 'knit-annotated-delta',
1841
 
                           'knit-ft', 'knit-delta', 'chunked', 'fulltext',
1842
 
                           'knit-annotated-ft-gz', 'knit-annotated-delta-gz', 'knit-ft-gz',
1843
 
                           'knit-delta-gz',
1844
 
                           'knit-delta-closure', 'knit-delta-closure-ref',
1845
 
                           'groupcompress-block', 'groupcompress-block-ref'])
1846
 
 
1847
 
    def capture_stream(self, f, entries, on_seen, parents,
1848
 
                       require_fulltext=False):
1849
 
        """Capture a stream for testing."""
1850
 
        for factory in entries:
1851
 
            on_seen(factory.key)
1852
 
            self.assertValidStorageKind(factory.storage_kind)
1853
 
            if factory.sha1 is not None:
1854
 
                self.assertEqual(f.get_sha1s([factory.key])[factory.key],
1855
 
                                 factory.sha1)
1856
 
            self.assertEqual(parents[factory.key], factory.parents)
1857
 
            self.assertIsInstance(factory.get_bytes_as(factory.storage_kind),
1858
 
                                  bytes)
1859
 
            if require_fulltext:
1860
 
                factory.get_bytes_as('fulltext')
1861
 
 
1862
 
    def test_get_record_stream_interface(self):
1863
 
        """each item in a stream has to provide a regular interface."""
1864
 
        files = self.get_versionedfiles()
1865
 
        self.get_diamond_files(files)
1866
 
        keys, _ = self.get_keys_and_sort_order()
1867
 
        parent_map = files.get_parent_map(keys)
1868
 
        entries = files.get_record_stream(keys, 'unordered', False)
1869
 
        seen = set()
1870
 
        self.capture_stream(files, entries, seen.add, parent_map)
1871
 
        self.assertEqual(set(keys), seen)
1872
 
 
1873
 
    def get_keys_and_sort_order(self):
1874
 
        """Get diamond test keys list, and their sort ordering."""
1875
 
        if self.key_length == 1:
1876
 
            keys = [(b'merged',), (b'left',), (b'right',), (b'base',)]
1877
 
            sort_order = {(b'merged',): 2, (b'left',): 1,
1878
 
                          (b'right',): 1, (b'base',): 0}
1879
 
        else:
1880
 
            keys = [
1881
 
                (b'FileA', b'merged'), (b'FileA', b'left'), (b'FileA', b'right'),
1882
 
                (b'FileA', b'base'),
1883
 
                (b'FileB', b'merged'), (b'FileB', b'left'), (b'FileB', b'right'),
1884
 
                (b'FileB', b'base'),
1885
 
                ]
1886
 
            sort_order = {
1887
 
                (b'FileA', b'merged'): 2, (b'FileA', b'left'): 1, (b'FileA', b'right'): 1,
1888
 
                (b'FileA', b'base'): 0,
1889
 
                (b'FileB', b'merged'): 2, (b'FileB', b'left'): 1, (b'FileB', b'right'): 1,
1890
 
                (b'FileB', b'base'): 0,
1891
 
                }
1892
 
        return keys, sort_order
1893
 
 
1894
 
    def get_keys_and_groupcompress_sort_order(self):
1895
 
        """Get diamond test keys list, and their groupcompress sort ordering."""
1896
 
        if self.key_length == 1:
1897
 
            keys = [(b'merged',), (b'left',), (b'right',), (b'base',)]
1898
 
            sort_order = {(b'merged',): 0, (b'left',): 1,
1899
 
                          (b'right',): 1, (b'base',): 2}
1900
 
        else:
1901
 
            keys = [
1902
 
                (b'FileA', b'merged'), (b'FileA', b'left'), (b'FileA', b'right'),
1903
 
                (b'FileA', b'base'),
1904
 
                (b'FileB', b'merged'), (b'FileB', b'left'), (b'FileB', b'right'),
1905
 
                (b'FileB', b'base'),
1906
 
                ]
1907
 
            sort_order = {
1908
 
                (b'FileA', b'merged'): 0, (b'FileA', b'left'): 1, (b'FileA', b'right'): 1,
1909
 
                (b'FileA', b'base'): 2,
1910
 
                (b'FileB', b'merged'): 3, (b'FileB', b'left'): 4, (b'FileB', b'right'): 4,
1911
 
                (b'FileB', b'base'): 5,
1912
 
                }
1913
 
        return keys, sort_order
1914
 
 
1915
 
    def test_get_record_stream_interface_ordered(self):
1916
 
        """each item in a stream has to provide a regular interface."""
1917
 
        files = self.get_versionedfiles()
1918
 
        self.get_diamond_files(files)
1919
 
        keys, sort_order = self.get_keys_and_sort_order()
1920
 
        parent_map = files.get_parent_map(keys)
1921
 
        entries = files.get_record_stream(keys, 'topological', False)
1922
 
        seen = []
1923
 
        self.capture_stream(files, entries, seen.append, parent_map)
1924
 
        self.assertStreamOrder(sort_order, seen, keys)
1925
 
 
1926
 
    def test_get_record_stream_interface_ordered_with_delta_closure(self):
1927
 
        """each item must be accessible as a fulltext."""
1928
 
        files = self.get_versionedfiles()
1929
 
        self.get_diamond_files(files)
1930
 
        keys, sort_order = self.get_keys_and_sort_order()
1931
 
        parent_map = files.get_parent_map(keys)
1932
 
        entries = files.get_record_stream(keys, 'topological', True)
1933
 
        seen = []
1934
 
        for factory in entries:
1935
 
            seen.append(factory.key)
1936
 
            self.assertValidStorageKind(factory.storage_kind)
1937
 
            self.assertSubset([factory.sha1],
1938
 
                              [None, files.get_sha1s([factory.key])[factory.key]])
1939
 
            self.assertEqual(parent_map[factory.key], factory.parents)
1940
 
            # self.assertEqual(files.get_text(factory.key),
1941
 
            ft_bytes = factory.get_bytes_as('fulltext')
1942
 
            self.assertIsInstance(ft_bytes, bytes)
1943
 
            chunked_bytes = factory.get_bytes_as('chunked')
1944
 
            self.assertEqualDiff(ft_bytes, b''.join(chunked_bytes))
1945
 
            chunked_bytes = factory.iter_bytes_as('chunked')
1946
 
            self.assertEqualDiff(ft_bytes, b''.join(chunked_bytes))
1947
 
 
1948
 
        self.assertStreamOrder(sort_order, seen, keys)
1949
 
 
1950
 
    def test_get_record_stream_interface_groupcompress(self):
1951
 
        """each item in a stream has to provide a regular interface."""
1952
 
        files = self.get_versionedfiles()
1953
 
        self.get_diamond_files(files)
1954
 
        keys, sort_order = self.get_keys_and_groupcompress_sort_order()
1955
 
        parent_map = files.get_parent_map(keys)
1956
 
        entries = files.get_record_stream(keys, 'groupcompress', False)
1957
 
        seen = []
1958
 
        self.capture_stream(files, entries, seen.append, parent_map)
1959
 
        self.assertStreamOrder(sort_order, seen, keys)
1960
 
 
1961
 
    def assertStreamOrder(self, sort_order, seen, keys):
1962
 
        self.assertEqual(len(set(seen)), len(keys))
1963
 
        if self.key_length == 1:
1964
 
            lows = {(): 0}
1965
 
        else:
1966
 
            lows = {(b'FileA',): 0, (b'FileB',): 0}
1967
 
        if not self.graph:
1968
 
            self.assertEqual(set(keys), set(seen))
1969
 
        else:
1970
 
            for key in seen:
1971
 
                sort_pos = sort_order[key]
1972
 
                self.assertTrue(sort_pos >= lows[key[:-1]],
1973
 
                                "Out of order in sorted stream: %r, %r" % (key, seen))
1974
 
                lows[key[:-1]] = sort_pos
1975
 
 
1976
 
    def test_get_record_stream_unknown_storage_kind_raises(self):
1977
 
        """Asking for a storage kind that the stream cannot supply raises."""
1978
 
        files = self.get_versionedfiles()
1979
 
        self.get_diamond_files(files)
1980
 
        if self.key_length == 1:
1981
 
            keys = [(b'merged',), (b'left',), (b'right',), (b'base',)]
1982
 
        else:
1983
 
            keys = [
1984
 
                (b'FileA', b'merged'), (b'FileA', b'left'), (b'FileA', b'right'),
1985
 
                (b'FileA', b'base'),
1986
 
                (b'FileB', b'merged'), (b'FileB', b'left'), (b'FileB', b'right'),
1987
 
                (b'FileB', b'base'),
1988
 
                ]
1989
 
        parent_map = files.get_parent_map(keys)
1990
 
        entries = files.get_record_stream(keys, 'unordered', False)
1991
 
        # We track the contents because we should be able to try, fail a
1992
 
        # particular kind and then ask for one that works and continue.
1993
 
        seen = set()
1994
 
        for factory in entries:
1995
 
            seen.add(factory.key)
1996
 
            self.assertValidStorageKind(factory.storage_kind)
1997
 
            if factory.sha1 is not None:
1998
 
                self.assertEqual(files.get_sha1s([factory.key])[factory.key],
1999
 
                                 factory.sha1)
2000
 
            self.assertEqual(parent_map[factory.key], factory.parents)
2001
 
            # currently no stream emits mpdiff
2002
 
            self.assertRaises(errors.UnavailableRepresentation,
2003
 
                              factory.get_bytes_as, 'mpdiff')
2004
 
            self.assertIsInstance(factory.get_bytes_as(factory.storage_kind),
2005
 
                                  bytes)
2006
 
        self.assertEqual(set(keys), seen)
2007
 
 
2008
 
    def test_get_record_stream_missing_records_are_absent(self):
2009
 
        files = self.get_versionedfiles()
2010
 
        self.get_diamond_files(files)
2011
 
        if self.key_length == 1:
2012
 
            keys = [(b'merged',), (b'left',), (b'right',),
2013
 
                    (b'absent',), (b'base',)]
2014
 
        else:
2015
 
            keys = [
2016
 
                (b'FileA', b'merged'), (b'FileA', b'left'), (b'FileA', b'right'),
2017
 
                (b'FileA', b'absent'), (b'FileA', b'base'),
2018
 
                (b'FileB', b'merged'), (b'FileB', b'left'), (b'FileB', b'right'),
2019
 
                (b'FileB', b'absent'), (b'FileB', b'base'),
2020
 
                (b'absent', b'absent'),
2021
 
                ]
2022
 
        parent_map = files.get_parent_map(keys)
2023
 
        entries = files.get_record_stream(keys, 'unordered', False)
2024
 
        self.assertAbsentRecord(files, keys, parent_map, entries)
2025
 
        entries = files.get_record_stream(keys, 'topological', False)
2026
 
        self.assertAbsentRecord(files, keys, parent_map, entries)
2027
 
 
2028
 
    def assertRecordHasContent(self, record, bytes):
2029
 
        """Assert that record has the bytes bytes."""
2030
 
        self.assertEqual(bytes, record.get_bytes_as('fulltext'))
2031
 
        self.assertEqual(bytes, b''.join(record.get_bytes_as('chunked')))
2032
 
 
2033
 
    def test_get_record_stream_native_formats_are_wire_ready_one_ft(self):
2034
 
        files = self.get_versionedfiles()
2035
 
        key = self.get_simple_key(b'foo')
2036
 
        files.add_lines(key, (), [b'my text\n', b'content'])
2037
 
        stream = files.get_record_stream([key], 'unordered', False)
2038
 
        record = next(stream)
2039
 
        if record.storage_kind in ('chunked', 'fulltext'):
2040
 
            # chunked and fulltext representations are for direct use not wire
2041
 
            # serialisation: check they are able to be used directly. To send
2042
 
            # such records over the wire translation will be needed.
2043
 
            self.assertRecordHasContent(record, b"my text\ncontent")
2044
 
        else:
2045
 
            bytes = [record.get_bytes_as(record.storage_kind)]
2046
 
            network_stream = versionedfile.NetworkRecordStream(bytes).read()
2047
 
            source_record = record
2048
 
            records = []
2049
 
            for record in network_stream:
2050
 
                records.append(record)
2051
 
                self.assertEqual(source_record.storage_kind,
2052
 
                                 record.storage_kind)
2053
 
                self.assertEqual(source_record.parents, record.parents)
2054
 
                self.assertEqual(
2055
 
                    source_record.get_bytes_as(source_record.storage_kind),
2056
 
                    record.get_bytes_as(record.storage_kind))
2057
 
            self.assertEqual(1, len(records))
2058
 
 
2059
 
    def assertStreamMetaEqual(self, records, expected, stream):
2060
 
        """Assert that streams expected and stream have the same records.
2061
 
 
2062
 
        :param records: A list to collect the seen records.
2063
 
        :return: A generator of the records in stream.
2064
 
        """
2065
 
        # We make assertions during copying to catch things early for easier
2066
 
        # debugging. This must use the iterating zip() from the future.
2067
 
        for record, ref_record in zip(stream, expected):
2068
 
            records.append(record)
2069
 
            self.assertEqual(ref_record.key, record.key)
2070
 
            self.assertEqual(ref_record.storage_kind, record.storage_kind)
2071
 
            self.assertEqual(ref_record.parents, record.parents)
2072
 
            yield record
2073
 
 
2074
 
    def stream_to_bytes_or_skip_counter(self, skipped_records, full_texts,
2075
 
                                        stream):
2076
 
        """Convert a stream to a bytes iterator.
2077
 
 
2078
 
        :param skipped_records: A list with one element to increment when a
2079
 
            record is skipped.
2080
 
        :param full_texts: A dict from key->fulltext representation, for
2081
 
            checking chunked or fulltext stored records.
2082
 
        :param stream: A record_stream.
2083
 
        :return: An iterator over the bytes of each record.
2084
 
        """
2085
 
        for record in stream:
2086
 
            if record.storage_kind in ('chunked', 'fulltext'):
2087
 
                skipped_records[0] += 1
2088
 
                # check the content is correct for direct use.
2089
 
                self.assertRecordHasContent(record, full_texts[record.key])
2090
 
            else:
2091
 
                yield record.get_bytes_as(record.storage_kind)
2092
 
 
2093
 
    def test_get_record_stream_native_formats_are_wire_ready_ft_delta(self):
2094
 
        files = self.get_versionedfiles()
2095
 
        target_files = self.get_versionedfiles('target')
2096
 
        key = self.get_simple_key(b'ft')
2097
 
        key_delta = self.get_simple_key(b'delta')
2098
 
        files.add_lines(key, (), [b'my text\n', b'content'])
2099
 
        if self.graph:
2100
 
            delta_parents = (key,)
2101
 
        else:
2102
 
            delta_parents = ()
2103
 
        files.add_lines(key_delta, delta_parents, [
2104
 
                        b'different\n', b'content\n'])
2105
 
        local = files.get_record_stream([key, key_delta], 'unordered', False)
2106
 
        ref = files.get_record_stream([key, key_delta], 'unordered', False)
2107
 
        skipped_records = [0]
2108
 
        full_texts = {
2109
 
            key: b"my text\ncontent",
2110
 
            key_delta: b"different\ncontent\n",
2111
 
            }
2112
 
        byte_stream = self.stream_to_bytes_or_skip_counter(
2113
 
            skipped_records, full_texts, local)
2114
 
        network_stream = versionedfile.NetworkRecordStream(byte_stream).read()
2115
 
        records = []
2116
 
        # insert the stream from the network into a versioned files object so we can
2117
 
        # check the content was carried across correctly without doing delta
2118
 
        # inspection.
2119
 
        target_files.insert_record_stream(
2120
 
            self.assertStreamMetaEqual(records, ref, network_stream))
2121
 
        # No duplicates on the wire thank you!
2122
 
        self.assertEqual(2, len(records) + skipped_records[0])
2123
 
        if len(records):
2124
 
            # if any content was copied it all must have all been.
2125
 
            self.assertIdenticalVersionedFile(files, target_files)
2126
 
 
2127
 
    def test_get_record_stream_native_formats_are_wire_ready_delta(self):
2128
 
        # copy a delta over the wire
2129
 
        files = self.get_versionedfiles()
2130
 
        target_files = self.get_versionedfiles('target')
2131
 
        key = self.get_simple_key(b'ft')
2132
 
        key_delta = self.get_simple_key(b'delta')
2133
 
        files.add_lines(key, (), [b'my text\n', b'content'])
2134
 
        if self.graph:
2135
 
            delta_parents = (key,)
2136
 
        else:
2137
 
            delta_parents = ()
2138
 
        files.add_lines(key_delta, delta_parents, [
2139
 
                        b'different\n', b'content\n'])
2140
 
        # Copy the basis text across so we can reconstruct the delta during
2141
 
        # insertion into target.
2142
 
        target_files.insert_record_stream(files.get_record_stream([key],
2143
 
                                                                  'unordered', False))
2144
 
        local = files.get_record_stream([key_delta], 'unordered', False)
2145
 
        ref = files.get_record_stream([key_delta], 'unordered', False)
2146
 
        skipped_records = [0]
2147
 
        full_texts = {
2148
 
            key_delta: b"different\ncontent\n",
2149
 
            }
2150
 
        byte_stream = self.stream_to_bytes_or_skip_counter(
2151
 
            skipped_records, full_texts, local)
2152
 
        network_stream = versionedfile.NetworkRecordStream(byte_stream).read()
2153
 
        records = []
2154
 
        # insert the stream from the network into a versioned files object so we can
2155
 
        # check the content was carried across correctly without doing delta
2156
 
        # inspection during check_stream.
2157
 
        target_files.insert_record_stream(
2158
 
            self.assertStreamMetaEqual(records, ref, network_stream))
2159
 
        # No duplicates on the wire thank you!
2160
 
        self.assertEqual(1, len(records) + skipped_records[0])
2161
 
        if len(records):
2162
 
            # if any content was copied it all must have all been
2163
 
            self.assertIdenticalVersionedFile(files, target_files)
2164
 
 
2165
 
    def test_get_record_stream_wire_ready_delta_closure_included(self):
2166
 
        # copy a delta over the wire with the ability to get its full text.
2167
 
        files = self.get_versionedfiles()
2168
 
        key = self.get_simple_key(b'ft')
2169
 
        key_delta = self.get_simple_key(b'delta')
2170
 
        files.add_lines(key, (), [b'my text\n', b'content'])
2171
 
        if self.graph:
2172
 
            delta_parents = (key,)
2173
 
        else:
2174
 
            delta_parents = ()
2175
 
        files.add_lines(key_delta, delta_parents, [
2176
 
                        b'different\n', b'content\n'])
2177
 
        local = files.get_record_stream([key_delta], 'unordered', True)
2178
 
        ref = files.get_record_stream([key_delta], 'unordered', True)
2179
 
        skipped_records = [0]
2180
 
        full_texts = {
2181
 
            key_delta: b"different\ncontent\n",
2182
 
            }
2183
 
        byte_stream = self.stream_to_bytes_or_skip_counter(
2184
 
            skipped_records, full_texts, local)
2185
 
        network_stream = versionedfile.NetworkRecordStream(byte_stream).read()
2186
 
        records = []
2187
 
        # insert the stream from the network into a versioned files object so we can
2188
 
        # check the content was carried across correctly without doing delta
2189
 
        # inspection during check_stream.
2190
 
        for record in self.assertStreamMetaEqual(records, ref, network_stream):
2191
 
            # we have to be able to get the full text out:
2192
 
            self.assertRecordHasContent(record, full_texts[record.key])
2193
 
        # No duplicates on the wire thank you!
2194
 
        self.assertEqual(1, len(records) + skipped_records[0])
2195
 
 
2196
 
    def assertAbsentRecord(self, files, keys, parents, entries):
2197
 
        """Helper for test_get_record_stream_missing_records_are_absent."""
2198
 
        seen = set()
2199
 
        for factory in entries:
2200
 
            seen.add(factory.key)
2201
 
            if factory.key[-1] == b'absent':
2202
 
                self.assertEqual('absent', factory.storage_kind)
2203
 
                self.assertEqual(None, factory.sha1)
2204
 
                self.assertEqual(None, factory.parents)
2205
 
            else:
2206
 
                self.assertValidStorageKind(factory.storage_kind)
2207
 
                if factory.sha1 is not None:
2208
 
                    sha1 = files.get_sha1s([factory.key])[factory.key]
2209
 
                    self.assertEqual(sha1, factory.sha1)
2210
 
                self.assertEqual(parents[factory.key], factory.parents)
2211
 
                self.assertIsInstance(factory.get_bytes_as(factory.storage_kind),
2212
 
                                      bytes)
2213
 
        self.assertEqual(set(keys), seen)
2214
 
 
2215
 
    def test_filter_absent_records(self):
2216
 
        """Requested missing records can be filter trivially."""
2217
 
        files = self.get_versionedfiles()
2218
 
        self.get_diamond_files(files)
2219
 
        keys, _ = self.get_keys_and_sort_order()
2220
 
        parent_map = files.get_parent_map(keys)
2221
 
        # Add an absent record in the middle of the present keys. (We don't ask
2222
 
        # for just absent keys to ensure that content before and after the
2223
 
        # absent keys is still delivered).
2224
 
        present_keys = list(keys)
2225
 
        if self.key_length == 1:
2226
 
            keys.insert(2, (b'extra',))
2227
 
        else:
2228
 
            keys.insert(2, (b'extra', b'extra'))
2229
 
        entries = files.get_record_stream(keys, 'unordered', False)
2230
 
        seen = set()
2231
 
        self.capture_stream(files, versionedfile.filter_absent(entries), seen.add,
2232
 
                            parent_map)
2233
 
        self.assertEqual(set(present_keys), seen)
2234
 
 
2235
 
    def get_mapper(self):
2236
 
        """Get a mapper suitable for the key length of the test interface."""
2237
 
        if self.key_length == 1:
2238
 
            return ConstantMapper('source')
2239
 
        else:
2240
 
            return HashEscapedPrefixMapper()
2241
 
 
2242
 
    def get_parents(self, parents):
2243
 
        """Get parents, taking self.graph into consideration."""
2244
 
        if self.graph:
2245
 
            return parents
2246
 
        else:
2247
 
            return None
2248
 
 
2249
 
    def test_get_annotator(self):
2250
 
        files = self.get_versionedfiles()
2251
 
        self.get_diamond_files(files)
2252
 
        origin_key = self.get_simple_key(b'origin')
2253
 
        base_key = self.get_simple_key(b'base')
2254
 
        left_key = self.get_simple_key(b'left')
2255
 
        right_key = self.get_simple_key(b'right')
2256
 
        merged_key = self.get_simple_key(b'merged')
2257
 
        # annotator = files.get_annotator()
2258
 
        # introduced full text
2259
 
        origins, lines = files.get_annotator().annotate(origin_key)
2260
 
        self.assertEqual([(origin_key,)], origins)
2261
 
        self.assertEqual([b'origin\n'], lines)
2262
 
        # a delta
2263
 
        origins, lines = files.get_annotator().annotate(base_key)
2264
 
        self.assertEqual([(base_key,)], origins)
2265
 
        # a merge
2266
 
        origins, lines = files.get_annotator().annotate(merged_key)
2267
 
        if self.graph:
2268
 
            self.assertEqual([
2269
 
                (base_key,),
2270
 
                (left_key,),
2271
 
                (right_key,),
2272
 
                (merged_key,),
2273
 
                ], origins)
2274
 
        else:
2275
 
            # Without a graph everything is new.
2276
 
            self.assertEqual([
2277
 
                (merged_key,),
2278
 
                (merged_key,),
2279
 
                (merged_key,),
2280
 
                (merged_key,),
2281
 
                ], origins)
2282
 
        self.assertRaises(RevisionNotPresent,
2283
 
                          files.get_annotator().annotate, self.get_simple_key(b'missing-key'))
2284
 
 
2285
 
    def test_get_parent_map(self):
2286
 
        files = self.get_versionedfiles()
2287
 
        if self.key_length == 1:
2288
 
            parent_details = [
2289
 
                ((b'r0',), self.get_parents(())),
2290
 
                ((b'r1',), self.get_parents(((b'r0',),))),
2291
 
                ((b'r2',), self.get_parents(())),
2292
 
                ((b'r3',), self.get_parents(())),
2293
 
                ((b'm',), self.get_parents(((b'r0',), (b'r1',), (b'r2',), (b'r3',)))),
2294
 
                ]
2295
 
        else:
2296
 
            parent_details = [
2297
 
                ((b'FileA', b'r0'), self.get_parents(())),
2298
 
                ((b'FileA', b'r1'), self.get_parents(((b'FileA', b'r0'),))),
2299
 
                ((b'FileA', b'r2'), self.get_parents(())),
2300
 
                ((b'FileA', b'r3'), self.get_parents(())),
2301
 
                ((b'FileA', b'm'), self.get_parents(((b'FileA', b'r0'),
2302
 
                                                     (b'FileA', b'r1'), (b'FileA', b'r2'), (b'FileA', b'r3')))),
2303
 
                ]
2304
 
        for key, parents in parent_details:
2305
 
            files.add_lines(key, parents, [])
2306
 
            # immediately after adding it should be queryable.
2307
 
            self.assertEqual({key: parents}, files.get_parent_map([key]))
2308
 
        # We can ask for an empty set
2309
 
        self.assertEqual({}, files.get_parent_map([]))
2310
 
        # We can ask for many keys
2311
 
        all_parents = dict(parent_details)
2312
 
        self.assertEqual(all_parents, files.get_parent_map(all_parents.keys()))
2313
 
        # Absent keys are just not included in the result.
2314
 
        keys = list(all_parents.keys())
2315
 
        if self.key_length == 1:
2316
 
            keys.insert(1, (b'missing',))
2317
 
        else:
2318
 
            keys.insert(1, (b'missing', b'missing'))
2319
 
        # Absent keys are just ignored
2320
 
        self.assertEqual(all_parents, files.get_parent_map(keys))
2321
 
 
2322
 
    def test_get_sha1s(self):
2323
 
        files = self.get_versionedfiles()
2324
 
        self.get_diamond_files(files)
2325
 
        if self.key_length == 1:
2326
 
            keys = [(b'base',), (b'origin',), (b'left',),
2327
 
                    (b'merged',), (b'right',)]
2328
 
        else:
2329
 
            # ask for shas from different prefixes.
2330
 
            keys = [
2331
 
                (b'FileA', b'base'), (b'FileB', b'origin'), (b'FileA', b'left'),
2332
 
                (b'FileA', b'merged'), (b'FileB', b'right'),
2333
 
                ]
2334
 
        self.assertEqual({
2335
 
            keys[0]: b'51c64a6f4fc375daf0d24aafbabe4d91b6f4bb44',
2336
 
            keys[1]: b'00e364d235126be43292ab09cb4686cf703ddc17',
2337
 
            keys[2]: b'a8478686da38e370e32e42e8a0c220e33ee9132f',
2338
 
            keys[3]: b'ed8bce375198ea62444dc71952b22cfc2b09226d',
2339
 
            keys[4]: b'9ef09dfa9d86780bdec9219a22560c6ece8e0ef1',
2340
 
            },
2341
 
            files.get_sha1s(keys))
2342
 
 
2343
 
    def test_insert_record_stream_empty(self):
2344
 
        """Inserting an empty record stream should work."""
2345
 
        files = self.get_versionedfiles()
2346
 
        files.insert_record_stream([])
2347
 
 
2348
 
    def assertIdenticalVersionedFile(self, expected, actual):
2349
 
        """Assert that left and right have the same contents."""
2350
 
        self.assertEqual(set(actual.keys()), set(expected.keys()))
2351
 
        actual_parents = actual.get_parent_map(actual.keys())
2352
 
        if self.graph:
2353
 
            self.assertEqual(
2354
 
                actual_parents, expected.get_parent_map(expected.keys()))
2355
 
        else:
2356
 
            for key, parents in actual_parents.items():
2357
 
                self.assertEqual(None, parents)
2358
 
        for key in actual.keys():
2359
 
            actual_text = next(actual.get_record_stream(
2360
 
                [key], 'unordered', True)).get_bytes_as('fulltext')
2361
 
            expected_text = next(expected.get_record_stream(
2362
 
                [key], 'unordered', True)).get_bytes_as('fulltext')
2363
 
            self.assertEqual(actual_text, expected_text)
2364
 
 
2365
 
    def test_insert_record_stream_fulltexts(self):
2366
 
        """Any file should accept a stream of fulltexts."""
2367
 
        files = self.get_versionedfiles()
2368
 
        mapper = self.get_mapper()
2369
 
        source_transport = self.get_transport('source')
2370
 
        source_transport.mkdir('.')
2371
 
        # weaves always output fulltexts.
2372
 
        source = make_versioned_files_factory(WeaveFile, mapper)(
2373
 
            source_transport)
2374
 
        self.get_diamond_files(source, trailing_eol=False)
2375
 
        stream = source.get_record_stream(source.keys(), 'topological',
2376
 
                                          False)
2377
 
        files.insert_record_stream(stream)
2378
 
        self.assertIdenticalVersionedFile(source, files)
2379
 
 
2380
 
    def test_insert_record_stream_fulltexts_noeol(self):
2381
 
        """Any file should accept a stream of fulltexts."""
2382
 
        files = self.get_versionedfiles()
2383
 
        mapper = self.get_mapper()
2384
 
        source_transport = self.get_transport('source')
2385
 
        source_transport.mkdir('.')
2386
 
        # weaves always output fulltexts.
2387
 
        source = make_versioned_files_factory(WeaveFile, mapper)(
2388
 
            source_transport)
2389
 
        self.get_diamond_files(source, trailing_eol=False)
2390
 
        stream = source.get_record_stream(source.keys(), 'topological',
2391
 
                                          False)
2392
 
        files.insert_record_stream(stream)
2393
 
        self.assertIdenticalVersionedFile(source, files)
2394
 
 
2395
 
    def test_insert_record_stream_annotated_knits(self):
2396
 
        """Any file should accept a stream from plain knits."""
2397
 
        files = self.get_versionedfiles()
2398
 
        mapper = self.get_mapper()
2399
 
        source_transport = self.get_transport('source')
2400
 
        source_transport.mkdir('.')
2401
 
        source = make_file_factory(True, mapper)(source_transport)
2402
 
        self.get_diamond_files(source)
2403
 
        stream = source.get_record_stream(source.keys(), 'topological',
2404
 
                                          False)
2405
 
        files.insert_record_stream(stream)
2406
 
        self.assertIdenticalVersionedFile(source, files)
2407
 
 
2408
 
    def test_insert_record_stream_annotated_knits_noeol(self):
2409
 
        """Any file should accept a stream from plain knits."""
2410
 
        files = self.get_versionedfiles()
2411
 
        mapper = self.get_mapper()
2412
 
        source_transport = self.get_transport('source')
2413
 
        source_transport.mkdir('.')
2414
 
        source = make_file_factory(True, mapper)(source_transport)
2415
 
        self.get_diamond_files(source, trailing_eol=False)
2416
 
        stream = source.get_record_stream(source.keys(), 'topological',
2417
 
                                          False)
2418
 
        files.insert_record_stream(stream)
2419
 
        self.assertIdenticalVersionedFile(source, files)
2420
 
 
2421
 
    def test_insert_record_stream_plain_knits(self):
2422
 
        """Any file should accept a stream from plain knits."""
2423
 
        files = self.get_versionedfiles()
2424
 
        mapper = self.get_mapper()
2425
 
        source_transport = self.get_transport('source')
2426
 
        source_transport.mkdir('.')
2427
 
        source = make_file_factory(False, mapper)(source_transport)
2428
 
        self.get_diamond_files(source)
2429
 
        stream = source.get_record_stream(source.keys(), 'topological',
2430
 
                                          False)
2431
 
        files.insert_record_stream(stream)
2432
 
        self.assertIdenticalVersionedFile(source, files)
2433
 
 
2434
 
    def test_insert_record_stream_plain_knits_noeol(self):
2435
 
        """Any file should accept a stream from plain knits."""
2436
 
        files = self.get_versionedfiles()
2437
 
        mapper = self.get_mapper()
2438
 
        source_transport = self.get_transport('source')
2439
 
        source_transport.mkdir('.')
2440
 
        source = make_file_factory(False, mapper)(source_transport)
2441
 
        self.get_diamond_files(source, trailing_eol=False)
2442
 
        stream = source.get_record_stream(source.keys(), 'topological',
2443
 
                                          False)
2444
 
        files.insert_record_stream(stream)
2445
 
        self.assertIdenticalVersionedFile(source, files)
2446
 
 
2447
 
    def test_insert_record_stream_existing_keys(self):
2448
 
        """Inserting keys already in a file should not error."""
2449
 
        files = self.get_versionedfiles()
2450
 
        source = self.get_versionedfiles('source')
2451
 
        self.get_diamond_files(source)
2452
 
        # insert some keys into f.
2453
 
        self.get_diamond_files(files, left_only=True)
2454
 
        stream = source.get_record_stream(source.keys(), 'topological',
2455
 
                                          False)
2456
 
        files.insert_record_stream(stream)
2457
 
        self.assertIdenticalVersionedFile(source, files)
2458
 
 
2459
 
    def test_insert_record_stream_missing_keys(self):
2460
 
        """Inserting a stream with absent keys should raise an error."""
2461
 
        files = self.get_versionedfiles()
2462
 
        source = self.get_versionedfiles('source')
2463
 
        stream = source.get_record_stream([(b'missing',) * self.key_length],
2464
 
                                          'topological', False)
2465
 
        self.assertRaises(errors.RevisionNotPresent, files.insert_record_stream,
2466
 
                          stream)
2467
 
 
2468
 
    def test_insert_record_stream_out_of_order(self):
2469
 
        """An out of order stream can either error or work."""
2470
 
        files = self.get_versionedfiles()
2471
 
        source = self.get_versionedfiles('source')
2472
 
        self.get_diamond_files(source)
2473
 
        if self.key_length == 1:
2474
 
            origin_keys = [(b'origin',)]
2475
 
            end_keys = [(b'merged',), (b'left',)]
2476
 
            start_keys = [(b'right',), (b'base',)]
2477
 
        else:
2478
 
            origin_keys = [(b'FileA', b'origin'), (b'FileB', b'origin')]
2479
 
            end_keys = [(b'FileA', b'merged',), (b'FileA', b'left',),
2480
 
                        (b'FileB', b'merged',), (b'FileB', b'left',)]
2481
 
            start_keys = [(b'FileA', b'right',), (b'FileA', b'base',),
2482
 
                          (b'FileB', b'right',), (b'FileB', b'base',)]
2483
 
        origin_entries = source.get_record_stream(
2484
 
            origin_keys, 'unordered', False)
2485
 
        end_entries = source.get_record_stream(end_keys, 'topological', False)
2486
 
        start_entries = source.get_record_stream(
2487
 
            start_keys, 'topological', False)
2488
 
        entries = itertools.chain(origin_entries, end_entries, start_entries)
2489
 
        try:
2490
 
            files.insert_record_stream(entries)
2491
 
        except RevisionNotPresent:
2492
 
            # Must not have corrupted the file.
2493
 
            files.check()
2494
 
        else:
2495
 
            self.assertIdenticalVersionedFile(source, files)
2496
 
 
2497
 
    def test_insert_record_stream_long_parent_chain_out_of_order(self):
2498
 
        """An out of order stream can either error or work."""
2499
 
        if not self.graph:
2500
 
            raise TestNotApplicable('ancestry info only relevant with graph.')
2501
 
        # Create a reasonably long chain of records based on each other, where
2502
 
        # most will be deltas.
2503
 
        source = self.get_versionedfiles('source')
2504
 
        parents = ()
2505
 
        keys = []
2506
 
        content = [(b'same same %d\n' % n) for n in range(500)]
2507
 
        letters = b'abcdefghijklmnopqrstuvwxyz'
2508
 
        for i in range(len(letters)):
2509
 
            letter = letters[i:i + 1]
2510
 
            key = (b'key-' + letter,)
2511
 
            if self.key_length == 2:
2512
 
                key = (b'prefix',) + key
2513
 
            content.append(b'content for ' + letter + b'\n')
2514
 
            source.add_lines(key, parents, content)
2515
 
            keys.append(key)
2516
 
            parents = (key,)
2517
 
        # Create a stream of these records, excluding the first record that the
2518
 
        # rest ultimately depend upon, and insert it into a new vf.
2519
 
        streams = []
2520
 
        for key in reversed(keys):
2521
 
            streams.append(source.get_record_stream([key], 'unordered', False))
2522
 
        deltas = itertools.chain.from_iterable(streams[:-1])
2523
 
        files = self.get_versionedfiles()
2524
 
        try:
2525
 
            files.insert_record_stream(deltas)
2526
 
        except RevisionNotPresent:
2527
 
            # Must not have corrupted the file.
2528
 
            files.check()
2529
 
        else:
2530
 
            # Must only report either just the first key as a missing parent,
2531
 
            # no key as missing (for nodelta scenarios).
2532
 
            missing = set(files.get_missing_compression_parent_keys())
2533
 
            missing.discard(keys[0])
2534
 
            self.assertEqual(set(), missing)
2535
 
 
2536
 
    def get_knit_delta_source(self):
2537
 
        """Get a source that can produce a stream with knit delta records,
2538
 
        regardless of this test's scenario.
2539
 
        """
2540
 
        mapper = self.get_mapper()
2541
 
        source_transport = self.get_transport('source')
2542
 
        source_transport.mkdir('.')
2543
 
        source = make_file_factory(False, mapper)(source_transport)
2544
 
        get_diamond_files(source, self.key_length, trailing_eol=True,
2545
 
                          nograph=False, left_only=False)
2546
 
        return source
2547
 
 
2548
 
    def test_insert_record_stream_delta_missing_basis_no_corruption(self):
2549
 
        """Insertion where a needed basis is not included notifies the caller
2550
 
        of the missing basis.  In the meantime a record missing its basis is
2551
 
        not added.
2552
 
        """
2553
 
        source = self.get_knit_delta_source()
2554
 
        keys = [self.get_simple_key(b'origin'), self.get_simple_key(b'merged')]
2555
 
        entries = source.get_record_stream(keys, 'unordered', False)
2556
 
        files = self.get_versionedfiles()
2557
 
        if self.support_partial_insertion:
2558
 
            self.assertEqual([],
2559
 
                             list(files.get_missing_compression_parent_keys()))
2560
 
            files.insert_record_stream(entries)
2561
 
            missing_bases = files.get_missing_compression_parent_keys()
2562
 
            self.assertEqual({self.get_simple_key(b'left')},
2563
 
                             set(missing_bases))
2564
 
            self.assertEqual(set(keys), set(files.get_parent_map(keys)))
2565
 
        else:
2566
 
            self.assertRaises(
2567
 
                errors.RevisionNotPresent, files.insert_record_stream, entries)
2568
 
            files.check()
2569
 
 
2570
 
    def test_insert_record_stream_delta_missing_basis_can_be_added_later(self):
2571
 
        """Insertion where a needed basis is not included notifies the caller
2572
 
        of the missing basis.  That basis can be added in a second
2573
 
        insert_record_stream call that does not need to repeat records present
2574
 
        in the previous stream.  The record(s) that required that basis are
2575
 
        fully inserted once their basis is no longer missing.
2576
 
        """
2577
 
        if not self.support_partial_insertion:
2578
 
            raise TestNotApplicable(
2579
 
                'versioned file scenario does not support partial insertion')
2580
 
        source = self.get_knit_delta_source()
2581
 
        entries = source.get_record_stream([self.get_simple_key(b'origin'),
2582
 
                                            self.get_simple_key(b'merged')], 'unordered', False)
2583
 
        files = self.get_versionedfiles()
2584
 
        files.insert_record_stream(entries)
2585
 
        missing_bases = files.get_missing_compression_parent_keys()
2586
 
        self.assertEqual({self.get_simple_key(b'left')},
2587
 
                         set(missing_bases))
2588
 
        # 'merged' is inserted (although a commit of a write group involving
2589
 
        # this versionedfiles would fail).
2590
 
        merged_key = self.get_simple_key(b'merged')
2591
 
        self.assertEqual(
2592
 
            [merged_key], list(files.get_parent_map([merged_key]).keys()))
2593
 
        # Add the full delta closure of the missing records
2594
 
        missing_entries = source.get_record_stream(
2595
 
            missing_bases, 'unordered', True)
2596
 
        files.insert_record_stream(missing_entries)
2597
 
        # Now 'merged' is fully inserted (and a commit would succeed).
2598
 
        self.assertEqual([], list(files.get_missing_compression_parent_keys()))
2599
 
        self.assertEqual(
2600
 
            [merged_key], list(files.get_parent_map([merged_key]).keys()))
2601
 
        files.check()
2602
 
 
2603
 
    def test_iter_lines_added_or_present_in_keys(self):
2604
 
        # test that we get at least an equalset of the lines added by
2605
 
        # versions in the store.
2606
 
        # the ordering here is to make a tree so that dumb searches have
2607
 
        # more changes to muck up.
2608
 
 
2609
 
        class InstrumentedProgress(progress.ProgressTask):
2610
 
 
2611
 
            def __init__(self):
2612
 
                progress.ProgressTask.__init__(self)
2613
 
                self.updates = []
2614
 
 
2615
 
            def update(self, msg=None, current=None, total=None):
2616
 
                self.updates.append((msg, current, total))
2617
 
 
2618
 
        files = self.get_versionedfiles()
2619
 
        # add a base to get included
2620
 
        files.add_lines(self.get_simple_key(b'base'), (), [b'base\n'])
2621
 
        # add a ancestor to be included on one side
2622
 
        files.add_lines(self.get_simple_key(
2623
 
            b'lancestor'), (), [b'lancestor\n'])
2624
 
        # add a ancestor to be included on the other side
2625
 
        files.add_lines(self.get_simple_key(b'rancestor'),
2626
 
                        self.get_parents([self.get_simple_key(b'base')]), [b'rancestor\n'])
2627
 
        # add a child of rancestor with no eofile-nl
2628
 
        files.add_lines(self.get_simple_key(b'child'),
2629
 
                        self.get_parents([self.get_simple_key(b'rancestor')]),
2630
 
                        [b'base\n', b'child\n'])
2631
 
        # add a child of lancestor and base to join the two roots
2632
 
        files.add_lines(self.get_simple_key(b'otherchild'),
2633
 
                        self.get_parents([self.get_simple_key(b'lancestor'),
2634
 
                                          self.get_simple_key(b'base')]),
2635
 
                        [b'base\n', b'lancestor\n', b'otherchild\n'])
2636
 
 
2637
 
        def iter_with_keys(keys, expected):
2638
 
            # now we need to see what lines are returned, and how often.
2639
 
            lines = {}
2640
 
            progress = InstrumentedProgress()
2641
 
            # iterate over the lines
2642
 
            for line in files.iter_lines_added_or_present_in_keys(keys,
2643
 
                                                                  pb=progress):
2644
 
                lines.setdefault(line, 0)
2645
 
                lines[line] += 1
2646
 
            if [] != progress.updates:
2647
 
                self.assertEqual(expected, progress.updates)
2648
 
            return lines
2649
 
        lines = iter_with_keys(
2650
 
            [self.get_simple_key(b'child'),
2651
 
             self.get_simple_key(b'otherchild')],
2652
 
            [('Walking content', 0, 2),
2653
 
             ('Walking content', 1, 2),
2654
 
             ('Walking content', 2, 2)])
2655
 
        # we must see child and otherchild
2656
 
        self.assertTrue(lines[(b'child\n', self.get_simple_key(b'child'))] > 0)
2657
 
        self.assertTrue(
2658
 
            lines[(b'otherchild\n', self.get_simple_key(b'otherchild'))] > 0)
2659
 
        # we dont care if we got more than that.
2660
 
 
2661
 
        # test all lines
2662
 
        lines = iter_with_keys(files.keys(),
2663
 
                               [('Walking content', 0, 5),
2664
 
                                ('Walking content', 1, 5),
2665
 
                                ('Walking content', 2, 5),
2666
 
                                ('Walking content', 3, 5),
2667
 
                                ('Walking content', 4, 5),
2668
 
                                ('Walking content', 5, 5)])
2669
 
        # all lines must be seen at least once
2670
 
        self.assertTrue(lines[(b'base\n', self.get_simple_key(b'base'))] > 0)
2671
 
        self.assertTrue(
2672
 
            lines[(b'lancestor\n', self.get_simple_key(b'lancestor'))] > 0)
2673
 
        self.assertTrue(
2674
 
            lines[(b'rancestor\n', self.get_simple_key(b'rancestor'))] > 0)
2675
 
        self.assertTrue(lines[(b'child\n', self.get_simple_key(b'child'))] > 0)
2676
 
        self.assertTrue(
2677
 
            lines[(b'otherchild\n', self.get_simple_key(b'otherchild'))] > 0)
2678
 
 
2679
 
    def test_make_mpdiffs(self):
2680
 
        from breezy import multiparent
2681
 
        files = self.get_versionedfiles('source')
2682
 
        # add texts that should trip the knit maximum delta chain threshold
2683
 
        # as well as doing parallel chains of data in knits.
2684
 
        # this is done by two chains of 25 insertions
2685
 
        files.add_lines(self.get_simple_key(b'base'), [], [b'line\n'])
2686
 
        files.add_lines(self.get_simple_key(b'noeol'),
2687
 
                        self.get_parents([self.get_simple_key(b'base')]), [b'line'])
2688
 
        # detailed eol tests:
2689
 
        # shared last line with parent no-eol
2690
 
        files.add_lines(self.get_simple_key(b'noeolsecond'),
2691
 
                        self.get_parents([self.get_simple_key(b'noeol')]),
2692
 
                        [b'line\n', b'line'])
2693
 
        # differing last line with parent, both no-eol
2694
 
        files.add_lines(self.get_simple_key(b'noeolnotshared'),
2695
 
                        self.get_parents(
2696
 
                            [self.get_simple_key(b'noeolsecond')]),
2697
 
                        [b'line\n', b'phone'])
2698
 
        # add eol following a noneol parent, change content
2699
 
        files.add_lines(self.get_simple_key(b'eol'),
2700
 
                        self.get_parents([self.get_simple_key(b'noeol')]), [b'phone\n'])
2701
 
        # add eol following a noneol parent, no change content
2702
 
        files.add_lines(self.get_simple_key(b'eolline'),
2703
 
                        self.get_parents([self.get_simple_key(b'noeol')]), [b'line\n'])
2704
 
        # noeol with no parents:
2705
 
        files.add_lines(self.get_simple_key(b'noeolbase'), [], [b'line'])
2706
 
        # noeol preceeding its leftmost parent in the output:
2707
 
        # this is done by making it a merge of two parents with no common
2708
 
        # anestry: noeolbase and noeol with the
2709
 
        # later-inserted parent the leftmost.
2710
 
        files.add_lines(self.get_simple_key(b'eolbeforefirstparent'),
2711
 
                        self.get_parents([self.get_simple_key(b'noeolbase'),
2712
 
                                          self.get_simple_key(b'noeol')]),
2713
 
                        [b'line'])
2714
 
        # two identical eol texts
2715
 
        files.add_lines(self.get_simple_key(b'noeoldup'),
2716
 
                        self.get_parents([self.get_simple_key(b'noeol')]), [b'line'])
2717
 
        next_parent = self.get_simple_key(b'base')
2718
 
        text_name = b'chain1-'
2719
 
        text = [b'line\n']
2720
 
        sha1s = {0: b'da6d3141cb4a5e6f464bf6e0518042ddc7bfd079',
2721
 
                 1: b'45e21ea146a81ea44a821737acdb4f9791c8abe7',
2722
 
                 2: b'e1f11570edf3e2a070052366c582837a4fe4e9fa',
2723
 
                 3: b'26b4b8626da827088c514b8f9bbe4ebf181edda1',
2724
 
                 4: b'e28a5510be25ba84d31121cff00956f9970ae6f6',
2725
 
                 5: b'd63ec0ce22e11dcf65a931b69255d3ac747a318d',
2726
 
                 6: b'2c2888d288cb5e1d98009d822fedfe6019c6a4ea',
2727
 
                 7: b'95c14da9cafbf828e3e74a6f016d87926ba234ab',
2728
 
                 8: b'779e9a0b28f9f832528d4b21e17e168c67697272',
2729
 
                 9: b'1f8ff4e5c6ff78ac106fcfe6b1e8cb8740ff9a8f',
2730
 
                 10: b'131a2ae712cf51ed62f143e3fbac3d4206c25a05',
2731
 
                 11: b'c5a9d6f520d2515e1ec401a8f8a67e6c3c89f199',
2732
 
                 12: b'31a2286267f24d8bedaa43355f8ad7129509ea85',
2733
 
                 13: b'dc2a7fe80e8ec5cae920973973a8ee28b2da5e0a',
2734
 
                 14: b'2c4b1736566b8ca6051e668de68650686a3922f2',
2735
 
                 15: b'5912e4ecd9b0c07be4d013e7e2bdcf9323276cde',
2736
 
                 16: b'b0d2e18d3559a00580f6b49804c23fea500feab3',
2737
 
                 17: b'8e1d43ad72f7562d7cb8f57ee584e20eb1a69fc7',
2738
 
                 18: b'5cf64a3459ae28efa60239e44b20312d25b253f3',
2739
 
                 19: b'1ebed371807ba5935958ad0884595126e8c4e823',
2740
 
                 20: b'2aa62a8b06fb3b3b892a3292a068ade69d5ee0d3',
2741
 
                 21: b'01edc447978004f6e4e962b417a4ae1955b6fe5d',
2742
 
                 22: b'd8d8dc49c4bf0bab401e0298bb5ad827768618bb',
2743
 
                 23: b'c21f62b1c482862983a8ffb2b0c64b3451876e3f',
2744
 
                 24: b'c0593fe795e00dff6b3c0fe857a074364d5f04fc',
2745
 
                 25: b'dd1a1cf2ba9cc225c3aff729953e6364bf1d1855',
2746
 
                 }
2747
 
        for depth in range(26):
2748
 
            new_version = self.get_simple_key(text_name + b'%d' % depth)
2749
 
            text = text + [b'line\n']
2750
 
            files.add_lines(new_version, self.get_parents([next_parent]), text)
2751
 
            next_parent = new_version
2752
 
        next_parent = self.get_simple_key(b'base')
2753
 
        text_name = b'chain2-'
2754
 
        text = [b'line\n']
2755
 
        for depth in range(26):
2756
 
            new_version = self.get_simple_key(text_name + b'%d' % depth)
2757
 
            text = text + [b'line\n']
2758
 
            files.add_lines(new_version, self.get_parents([next_parent]), text)
2759
 
            next_parent = new_version
2760
 
        target = self.get_versionedfiles('target')
2761
 
        for key in multiparent.topo_iter_keys(files, files.keys()):
2762
 
            mpdiff = files.make_mpdiffs([key])[0]
2763
 
            parents = files.get_parent_map([key])[key] or []
2764
 
            target.add_mpdiffs(
2765
 
                [(key, parents, files.get_sha1s([key])[key], mpdiff)])
2766
 
            self.assertEqualDiff(
2767
 
                next(files.get_record_stream([key], 'unordered',
2768
 
                                             True)).get_bytes_as('fulltext'),
2769
 
                next(target.get_record_stream([key], 'unordered',
2770
 
                                              True)).get_bytes_as('fulltext')
2771
 
                )
2772
 
 
2773
 
    def test_keys(self):
2774
 
        # While use is discouraged, versions() is still needed by aspects of
2775
 
        # bzr.
2776
 
        files = self.get_versionedfiles()
2777
 
        self.assertEqual(set(), set(files.keys()))
2778
 
        if self.key_length == 1:
2779
 
            key = (b'foo',)
2780
 
        else:
2781
 
            key = (b'foo', b'bar',)
2782
 
        files.add_lines(key, (), [])
2783
 
        self.assertEqual({key}, set(files.keys()))
2784
 
 
2785
 
 
2786
 
class VirtualVersionedFilesTests(TestCase):
2787
 
    """Basic tests for the VirtualVersionedFiles implementations."""
2788
 
 
2789
 
    def _get_parent_map(self, keys):
2790
 
        ret = {}
2791
 
        for k in keys:
2792
 
            if k in self._parent_map:
2793
 
                ret[k] = self._parent_map[k]
2794
 
        return ret
2795
 
 
2796
 
    def setUp(self):
2797
 
        super(VirtualVersionedFilesTests, self).setUp()
2798
 
        self._lines = {}
2799
 
        self._parent_map = {}
2800
 
        self.texts = VirtualVersionedFiles(self._get_parent_map,
2801
 
                                           self._lines.get)
2802
 
 
2803
 
    def test_add_lines(self):
2804
 
        self.assertRaises(NotImplementedError,
2805
 
                          self.texts.add_lines, b"foo", [], [])
2806
 
 
2807
 
    def test_add_mpdiffs(self):
2808
 
        self.assertRaises(NotImplementedError,
2809
 
                          self.texts.add_mpdiffs, [])
2810
 
 
2811
 
    def test_check_noerrors(self):
2812
 
        self.texts.check()
2813
 
 
2814
 
    def test_insert_record_stream(self):
2815
 
        self.assertRaises(NotImplementedError, self.texts.insert_record_stream,
2816
 
                          [])
2817
 
 
2818
 
    def test_get_sha1s_nonexistent(self):
2819
 
        self.assertEqual({}, self.texts.get_sha1s([(b"NONEXISTENT",)]))
2820
 
 
2821
 
    def test_get_sha1s(self):
2822
 
        self._lines[b"key"] = [b"dataline1", b"dataline2"]
2823
 
        self.assertEqual({(b"key",): osutils.sha_strings(self._lines[b"key"])},
2824
 
                         self.texts.get_sha1s([(b"key",)]))
2825
 
 
2826
 
    def test_get_parent_map(self):
2827
 
        self._parent_map = {b"G": (b"A", b"B")}
2828
 
        self.assertEqual({(b"G",): ((b"A",), (b"B",))},
2829
 
                         self.texts.get_parent_map([(b"G",), (b"L",)]))
2830
 
 
2831
 
    def test_get_record_stream(self):
2832
 
        self._lines[b"A"] = [b"FOO", b"BAR"]
2833
 
        it = self.texts.get_record_stream([(b"A",)], "unordered", True)
2834
 
        record = next(it)
2835
 
        self.assertEqual("chunked", record.storage_kind)
2836
 
        self.assertEqual(b"FOOBAR", record.get_bytes_as("fulltext"))
2837
 
        self.assertEqual([b"FOO", b"BAR"], record.get_bytes_as("chunked"))
2838
 
 
2839
 
    def test_get_record_stream_absent(self):
2840
 
        it = self.texts.get_record_stream([(b"A",)], "unordered", True)
2841
 
        record = next(it)
2842
 
        self.assertEqual("absent", record.storage_kind)
2843
 
 
2844
 
    def test_iter_lines_added_or_present_in_keys(self):
2845
 
        self._lines[b"A"] = [b"FOO", b"BAR"]
2846
 
        self._lines[b"B"] = [b"HEY"]
2847
 
        self._lines[b"C"] = [b"Alberta"]
2848
 
        it = self.texts.iter_lines_added_or_present_in_keys([(b"A",), (b"B",)])
2849
 
        self.assertEqual(sorted([(b"FOO", b"A"), (b"BAR", b"A"), (b"HEY", b"B")]),
2850
 
                         sorted(list(it)))
2851
 
 
2852
 
 
2853
 
class TestOrderingVersionedFilesDecorator(TestCaseWithMemoryTransport):
2854
 
 
2855
 
    def get_ordering_vf(self, key_priority):
2856
 
        builder = self.make_branch_builder('test')
2857
 
        builder.start_series()
2858
 
        builder.build_snapshot(None, [
2859
 
            ('add', ('', b'TREE_ROOT', 'directory', None))],
2860
 
            revision_id=b'A')
2861
 
        builder.build_snapshot([b'A'], [], revision_id=b'B')
2862
 
        builder.build_snapshot([b'B'], [], revision_id=b'C')
2863
 
        builder.build_snapshot([b'C'], [], revision_id=b'D')
2864
 
        builder.finish_series()
2865
 
        b = builder.get_branch()
2866
 
        b.lock_read()
2867
 
        self.addCleanup(b.unlock)
2868
 
        vf = b.repository.inventories
2869
 
        return versionedfile.OrderingVersionedFilesDecorator(vf, key_priority)
2870
 
 
2871
 
    def test_get_empty(self):
2872
 
        vf = self.get_ordering_vf({})
2873
 
        self.assertEqual([], vf.calls)
2874
 
 
2875
 
    def test_get_record_stream_topological(self):
2876
 
        vf = self.get_ordering_vf(
2877
 
            {(b'A',): 3, (b'B',): 2, (b'C',): 4, (b'D',): 1})
2878
 
        request_keys = [(b'B',), (b'C',), (b'D',), (b'A',)]
2879
 
        keys = [r.key for r in vf.get_record_stream(request_keys,
2880
 
                                                    'topological', False)]
2881
 
        # We should have gotten the keys in topological order
2882
 
        self.assertEqual([(b'A',), (b'B',), (b'C',), (b'D',)], keys)
2883
 
        # And recorded that the request was made
2884
 
        self.assertEqual([('get_record_stream', request_keys, 'topological',
2885
 
                           False)], vf.calls)
2886
 
 
2887
 
    def test_get_record_stream_ordered(self):
2888
 
        vf = self.get_ordering_vf(
2889
 
            {(b'A',): 3, (b'B',): 2, (b'C',): 4, (b'D',): 1})
2890
 
        request_keys = [(b'B',), (b'C',), (b'D',), (b'A',)]
2891
 
        keys = [r.key for r in vf.get_record_stream(request_keys,
2892
 
                                                    'unordered', False)]
2893
 
        # They should be returned based on their priority
2894
 
        self.assertEqual([(b'D',), (b'B',), (b'A',), (b'C',)], keys)
2895
 
        # And the request recorded
2896
 
        self.assertEqual([('get_record_stream', request_keys, 'unordered',
2897
 
                           False)], vf.calls)
2898
 
 
2899
 
    def test_get_record_stream_implicit_order(self):
2900
 
        vf = self.get_ordering_vf({(b'B',): 2, (b'D',): 1})
2901
 
        request_keys = [(b'B',), (b'C',), (b'D',), (b'A',)]
2902
 
        keys = [r.key for r in vf.get_record_stream(request_keys,
2903
 
                                                    'unordered', False)]
2904
 
        # A and C are not in the map, so they get sorted to the front. A comes
2905
 
        # before C alphabetically, so it comes back first
2906
 
        self.assertEqual([(b'A',), (b'C',), (b'D',), (b'B',)], keys)
2907
 
        # And the request recorded
2908
 
        self.assertEqual([('get_record_stream', request_keys, 'unordered',
2909
 
                           False)], vf.calls)
 
1129
    overlappedInsertExpected = ['aaa', '<<<<<<< ', 'xxx', 'yyy', '=======', 
 
1130
                                'xxx', '>>>>>>> ', 'bbb']