/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/inventory.py

  • Committer: Robert Collins
  • Date: 2005-10-02 21:51:29 UTC
  • mfrom: (1396)
  • mto: This revision was merged to the branch mainline in revision 1397.
  • Revision ID: robertc@robertcollins.net-20051002215128-5686c7d24bf9bdb9
merge from martins newformat branch - brings in transport abstraction

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
# TODO: Maybe also keep the full path of the entry, and the children?
 
19
# But those depend on its position within a particular inventory, and
 
20
# it would be nice not to need to hold the backpointer here.
 
21
 
 
22
# TODO: Perhaps split InventoryEntry into subclasses for files,
 
23
# directories, etc etc.
 
24
 
 
25
 
 
26
# This should really be an id randomly assigned when the tree is
 
27
# created, but it's not for now.
 
28
ROOT_ID = "TREE_ROOT"
 
29
 
 
30
 
 
31
import os.path
 
32
import re
 
33
import sys
 
34
import types
 
35
 
 
36
import bzrlib
 
37
from bzrlib.errors import BzrError, BzrCheckError
 
38
 
 
39
from bzrlib.osutils import quotefn, splitpath, joinpath, appendpath, sha_strings
 
40
from bzrlib.trace import mutter
 
41
from bzrlib.errors import NotVersionedError
 
42
 
 
43
 
 
44
class InventoryEntry(object):
 
45
    """Description of a versioned file.
 
46
 
 
47
    An InventoryEntry has the following fields, which are also
 
48
    present in the XML inventory-entry element:
 
49
 
 
50
    file_id
 
51
 
 
52
    name
 
53
        (within the parent directory)
 
54
 
 
55
    kind
 
56
        'directory' or 'file'
 
57
 
 
58
    parent_id
 
59
        file_id of the parent directory, or ROOT_ID
 
60
 
 
61
    revision
 
62
        the revision_id in which this variationo f this file was 
 
63
        introduced.
 
64
 
 
65
    text_sha1
 
66
        sha-1 of the text of the file
 
67
        
 
68
    text_size
 
69
        size in bytes of the text of the file
 
70
        
 
71
    (reading a version 4 tree created a text_id field.)
 
72
 
 
73
    >>> i = Inventory()
 
74
    >>> i.path2id('')
 
75
    'TREE_ROOT'
 
76
    >>> i.add(InventoryEntry('123', 'src', 'directory', ROOT_ID))
 
77
    InventoryEntry('123', 'src', kind='directory', parent_id='TREE_ROOT')
 
78
    >>> i.add(InventoryEntry('2323', 'hello.c', 'file', parent_id='123'))
 
79
    InventoryEntry('2323', 'hello.c', kind='file', parent_id='123')
 
80
    >>> for j in i.iter_entries():
 
81
    ...   print j
 
82
    ... 
 
83
    ('src', InventoryEntry('123', 'src', kind='directory', parent_id='TREE_ROOT'))
 
84
    ('src/hello.c', InventoryEntry('2323', 'hello.c', kind='file', parent_id='123'))
 
85
    >>> i.add(InventoryEntry('2323', 'bye.c', 'file', '123'))
 
86
    Traceback (most recent call last):
 
87
    ...
 
88
    BzrError: inventory already contains entry with id {2323}
 
89
    >>> i.add(InventoryEntry('2324', 'bye.c', 'file', '123'))
 
90
    InventoryEntry('2324', 'bye.c', kind='file', parent_id='123')
 
91
    >>> i.add(InventoryEntry('2325', 'wibble', 'directory', '123'))
 
92
    InventoryEntry('2325', 'wibble', kind='directory', parent_id='123')
 
93
    >>> i.path2id('src/wibble')
 
94
    '2325'
 
95
    >>> '2325' in i
 
96
    True
 
97
    >>> i.add(InventoryEntry('2326', 'wibble.c', 'file', '2325'))
 
98
    InventoryEntry('2326', 'wibble.c', kind='file', parent_id='2325')
 
99
    >>> i['2326']
 
100
    InventoryEntry('2326', 'wibble.c', kind='file', parent_id='2325')
 
101
    >>> for path, entry in i.iter_entries():
 
102
    ...     print path.replace('\\\\', '/')     # for win32 os.sep
 
103
    ...     assert i.path2id(path)
 
104
    ... 
 
105
    src
 
106
    src/bye.c
 
107
    src/hello.c
 
108
    src/wibble
 
109
    src/wibble/wibble.c
 
110
    >>> i.id2path('2326').replace('\\\\', '/')
 
111
    'src/wibble/wibble.c'
 
112
    """
 
113
    
 
114
    __slots__ = ['text_sha1', 'text_size', 'file_id', 'name', 'kind',
 
115
                 'text_id', 'parent_id', 'children',
 
116
                 'revision', 'symlink_target']
 
117
 
 
118
    def _add_text_to_weave(self, new_lines, parents, weave_store):
 
119
        weave_store.add_text(self.file_id, self.revision, new_lines, parents)
 
120
 
 
121
    def __init__(self, file_id, name, kind, parent_id, text_id=None):
 
122
        """Create an InventoryEntry
 
123
        
 
124
        The filename must be a single component, relative to the
 
125
        parent directory; it cannot be a whole path or relative name.
 
126
 
 
127
        >>> e = InventoryEntry('123', 'hello.c', 'file', ROOT_ID)
 
128
        >>> e.name
 
129
        'hello.c'
 
130
        >>> e.file_id
 
131
        '123'
 
132
        >>> e = InventoryEntry('123', 'src/hello.c', 'file', ROOT_ID)
 
133
        Traceback (most recent call last):
 
134
        BzrCheckError: InventoryEntry name 'src/hello.c' is invalid
 
135
        """
 
136
        assert isinstance(name, basestring), name
 
137
        if '/' in name or '\\' in name:
 
138
            raise BzrCheckError('InventoryEntry name %r is invalid' % name)
 
139
        
 
140
        self.revision = None
 
141
        self.text_sha1 = None
 
142
        self.text_size = None
 
143
        self.file_id = file_id
 
144
        self.name = name
 
145
        self.kind = kind
 
146
        self.text_id = text_id
 
147
        self.parent_id = parent_id
 
148
        self.symlink_target = None
 
149
        if kind == 'directory':
 
150
            self.children = {}
 
151
        elif kind == 'file':
 
152
            pass
 
153
        elif kind == 'symlink':
 
154
            pass
 
155
        else:
 
156
            raise BzrError("unhandled entry kind %r" % kind)
 
157
 
 
158
    def read_symlink_target(self, path):
 
159
        if self.kind == 'symlink':
 
160
            try:
 
161
                self.symlink_target = os.readlink(path)
 
162
            except OSError,e:
 
163
                raise BzrError("os.readlink error, %s" % e)
 
164
 
 
165
    def sorted_children(self):
 
166
        l = self.children.items()
 
167
        l.sort()
 
168
        return l
 
169
 
 
170
    def check(self, checker, rev_id, inv, tree):
 
171
        if self.parent_id != None:
 
172
            if not inv.has_id(self.parent_id):
 
173
                raise BzrCheckError('missing parent {%s} in inventory for revision {%s}'
 
174
                        % (self.parent_id, rev_id))
 
175
        if self.kind == 'file':
 
176
            revision = self.revision
 
177
            t = (self.file_id, revision)
 
178
            if t in checker.checked_texts:
 
179
                prev_sha = checker.checked_texts[t] 
 
180
                if prev_sha != self.text_sha1:
 
181
                    raise BzrCheckError('mismatched sha1 on {%s} in {%s}' %
 
182
                                        (self.file_id, rev_id))
 
183
                else:
 
184
                    checker.repeated_text_cnt += 1
 
185
                    return
 
186
            mutter('check version {%s} of {%s}', rev_id, self.file_id)
 
187
            file_lines = tree.get_file_lines(self.file_id)
 
188
            checker.checked_text_cnt += 1 
 
189
            if self.text_size != sum(map(len, file_lines)):
 
190
                raise BzrCheckError('text {%s} wrong size' % self.text_id)
 
191
            if self.text_sha1 != sha_strings(file_lines):
 
192
                raise BzrCheckError('text {%s} wrong sha1' % self.text_id)
 
193
            checker.checked_texts[t] = self.text_sha1
 
194
        elif self.kind == 'directory':
 
195
            if self.text_sha1 != None or self.text_size != None or self.text_id != None:
 
196
                raise BzrCheckError('directory {%s} has text in revision {%s}'
 
197
                        % (self.file_id, rev_id))
 
198
        elif self.kind == 'root_directory':
 
199
            pass
 
200
        elif self.kind == 'symlink':
 
201
            if self.text_sha1 != None or self.text_size != None or self.text_id != None:
 
202
                raise BzrCheckError('symlink {%s} has text in revision {%s}'
 
203
                        % (self.file_id, rev_id))
 
204
            if self.symlink_target == None:
 
205
                raise BzrCheckError('symlink {%s} has no target in revision {%s}'
 
206
                        % (self.file_id, rev_id))
 
207
        else:
 
208
            raise BzrCheckError('unknown entry kind %r in revision {%s}' % 
 
209
                                (self.kind, rev_id))
 
210
 
 
211
 
 
212
    def copy(self):
 
213
        other = InventoryEntry(self.file_id, self.name, self.kind,
 
214
                               self.parent_id)
 
215
        other.text_id = self.text_id
 
216
        other.text_sha1 = self.text_sha1
 
217
        other.text_size = self.text_size
 
218
        other.symlink_target = self.symlink_target
 
219
        other.revision = self.revision
 
220
        # note that children are *not* copied; they're pulled across when
 
221
        # others are added
 
222
        return other
 
223
 
 
224
    def _get_snapshot_change(self, previous_entries):
 
225
        if len(previous_entries) > 1:
 
226
            return 'merged'
 
227
        elif len(previous_entries) == 0:
 
228
            return 'added'
 
229
        else:
 
230
            return 'modified/renamed/reparented'
 
231
 
 
232
    def __repr__(self):
 
233
        return ("%s(%r, %r, kind=%r, parent_id=%r)"
 
234
                % (self.__class__.__name__,
 
235
                   self.file_id,
 
236
                   self.name,
 
237
                   self.kind,
 
238
                   self.parent_id))
 
239
 
 
240
    def snapshot(self, revision, path, previous_entries, work_tree, 
 
241
                 weave_store):
 
242
        """Make a snapshot of this entry.
 
243
        
 
244
        This means that all its fields are populated, that it has its
 
245
        text stored in the text store or weave.
 
246
        """
 
247
        mutter('new parents of %s are %r', path, previous_entries)
 
248
        self._read_tree_state(path, work_tree)
 
249
        if len(previous_entries) == 1:
 
250
            # cannot be unchanged unless there is only one parent file rev.
 
251
            parent_ie = previous_entries.values()[0]
 
252
            if self._unchanged(path, parent_ie, work_tree):
 
253
                mutter("found unchanged entry")
 
254
                self.revision = parent_ie.revision
 
255
                return "unchanged"
 
256
        mutter('new revision for {%s}', self.file_id)
 
257
        self.revision = revision
 
258
        change = self._get_snapshot_change(previous_entries)
 
259
        if self.kind != 'file':
 
260
            return change
 
261
        self._snapshot_text(previous_entries, work_tree, weave_store)
 
262
        return change
 
263
 
 
264
    def _snapshot_text(self, file_parents, work_tree, weave_store): 
 
265
        mutter('storing file {%s} in revision {%s}',
 
266
               self.file_id, self.revision)
 
267
        # special case to avoid diffing on renames or 
 
268
        # reparenting
 
269
        if (len(file_parents) == 1
 
270
            and self.text_sha1 == file_parents.values()[0].text_sha1
 
271
            and self.text_size == file_parents.values()[0].text_size):
 
272
            previous_ie = file_parents.values()[0]
 
273
            weave_store.add_identical_text(
 
274
                self.file_id, previous_ie.revision, 
 
275
                self.revision, file_parents)
 
276
        else:
 
277
            new_lines = work_tree.get_file(self.file_id).readlines()
 
278
            self._add_text_to_weave(new_lines, file_parents, weave_store)
 
279
            self.text_sha1 = sha_strings(new_lines)
 
280
            self.text_size = sum(map(len, new_lines))
 
281
 
 
282
    def __eq__(self, other):
 
283
        if not isinstance(other, InventoryEntry):
 
284
            return NotImplemented
 
285
 
 
286
        return (self.file_id == other.file_id) \
 
287
               and (self.name == other.name) \
 
288
               and (other.symlink_target == self.symlink_target) \
 
289
               and (self.text_sha1 == other.text_sha1) \
 
290
               and (self.text_size == other.text_size) \
 
291
               and (self.text_id == other.text_id) \
 
292
               and (self.parent_id == other.parent_id) \
 
293
               and (self.kind == other.kind) \
 
294
               and (self.revision == other.revision)
 
295
 
 
296
    def __ne__(self, other):
 
297
        return not (self == other)
 
298
 
 
299
    def __hash__(self):
 
300
        raise ValueError('not hashable')
 
301
 
 
302
    def _unchanged(self, path, previous_ie, work_tree):
 
303
        compatible = True
 
304
        # different inv parent
 
305
        if previous_ie.parent_id != self.parent_id:
 
306
            compatible = False
 
307
        # renamed
 
308
        elif previous_ie.name != self.name:
 
309
            compatible = False
 
310
        if self.kind == 'symlink':
 
311
            if self.symlink_target != previous_ie.symlink_target:
 
312
                compatible = False
 
313
        if self.kind == 'file':
 
314
            if self.text_sha1 != previous_ie.text_sha1:
 
315
                compatible = False
 
316
            else:
 
317
                # FIXME: 20050930 probe for the text size when getting sha1
 
318
                # in _read_tree_state
 
319
                self.text_size = previous_ie.text_size
 
320
        return compatible
 
321
 
 
322
    def _read_tree_state(self, path, work_tree):
 
323
        if self.kind == 'symlink':
 
324
            self.read_symlink_target(work_tree.abspath(path))
 
325
        if self.kind == 'file':
 
326
            self.text_sha1 = work_tree.get_file_sha1(self.file_id)
 
327
 
 
328
 
 
329
class RootEntry(InventoryEntry):
 
330
    def __init__(self, file_id):
 
331
        self.file_id = file_id
 
332
        self.children = {}
 
333
        self.kind = 'root_directory'
 
334
        self.parent_id = None
 
335
        self.name = ''
 
336
 
 
337
    def __eq__(self, other):
 
338
        if not isinstance(other, RootEntry):
 
339
            return NotImplemented
 
340
        
 
341
        return (self.file_id == other.file_id) \
 
342
               and (self.children == other.children)
 
343
 
 
344
 
 
345
 
 
346
class Inventory(object):
 
347
    """Inventory of versioned files in a tree.
 
348
 
 
349
    This describes which file_id is present at each point in the tree,
 
350
    and possibly the SHA-1 or other information about the file.
 
351
    Entries can be looked up either by path or by file_id.
 
352
 
 
353
    The inventory represents a typical unix file tree, with
 
354
    directories containing files and subdirectories.  We never store
 
355
    the full path to a file, because renaming a directory implicitly
 
356
    moves all of its contents.  This class internally maintains a
 
357
    lookup tree that allows the children under a directory to be
 
358
    returned quickly.
 
359
 
 
360
    InventoryEntry objects must not be modified after they are
 
361
    inserted, other than through the Inventory API.
 
362
 
 
363
    >>> inv = Inventory()
 
364
    >>> inv.add(InventoryEntry('123-123', 'hello.c', 'file', ROOT_ID))
 
365
    InventoryEntry('123-123', 'hello.c', kind='file', parent_id='TREE_ROOT')
 
366
    >>> inv['123-123'].name
 
367
    'hello.c'
 
368
 
 
369
    May be treated as an iterator or set to look up file ids:
 
370
    
 
371
    >>> bool(inv.path2id('hello.c'))
 
372
    True
 
373
    >>> '123-123' in inv
 
374
    True
 
375
 
 
376
    May also look up by name:
 
377
 
 
378
    >>> [x[0] for x in inv.iter_entries()]
 
379
    ['hello.c']
 
380
    >>> inv = Inventory('TREE_ROOT-12345678-12345678')
 
381
    >>> inv.add(InventoryEntry('123-123', 'hello.c', 'file', ROOT_ID))
 
382
    InventoryEntry('123-123', 'hello.c', kind='file', parent_id='TREE_ROOT-12345678-12345678')
 
383
    """
 
384
    def __init__(self, root_id=ROOT_ID):
 
385
        """Create or read an inventory.
 
386
 
 
387
        If a working directory is specified, the inventory is read
 
388
        from there.  If the file is specified, read from that. If not,
 
389
        the inventory is created empty.
 
390
 
 
391
        The inventory is created with a default root directory, with
 
392
        an id of None.
 
393
        """
 
394
        # We are letting Branch.initialize() create a unique inventory
 
395
        # root id. Rather than generating a random one here.
 
396
        #if root_id is None:
 
397
        #    root_id = bzrlib.branch.gen_file_id('TREE_ROOT')
 
398
        self.root = RootEntry(root_id)
 
399
        self._byid = {self.root.file_id: self.root}
 
400
 
 
401
 
 
402
    def copy(self):
 
403
        other = Inventory(self.root.file_id)
 
404
        # copy recursively so we know directories will be added before
 
405
        # their children.  There are more efficient ways than this...
 
406
        for path, entry in self.iter_entries():
 
407
            if entry == self.root:
 
408
                continue
 
409
            other.add(entry.copy())
 
410
        return other
 
411
 
 
412
 
 
413
    def __iter__(self):
 
414
        return iter(self._byid)
 
415
 
 
416
 
 
417
    def __len__(self):
 
418
        """Returns number of entries."""
 
419
        return len(self._byid)
 
420
 
 
421
 
 
422
    def iter_entries(self, from_dir=None):
 
423
        """Return (path, entry) pairs, in order by name."""
 
424
        if from_dir == None:
 
425
            assert self.root
 
426
            from_dir = self.root
 
427
        elif isinstance(from_dir, basestring):
 
428
            from_dir = self._byid[from_dir]
 
429
            
 
430
        kids = from_dir.children.items()
 
431
        kids.sort()
 
432
        for name, ie in kids:
 
433
            yield name, ie
 
434
            if ie.kind == 'directory':
 
435
                for cn, cie in self.iter_entries(from_dir=ie.file_id):
 
436
                    yield os.path.join(name, cn), cie
 
437
 
 
438
 
 
439
    def entries(self):
 
440
        """Return list of (path, ie) for all entries except the root.
 
441
 
 
442
        This may be faster than iter_entries.
 
443
        """
 
444
        accum = []
 
445
        def descend(dir_ie, dir_path):
 
446
            kids = dir_ie.children.items()
 
447
            kids.sort()
 
448
            for name, ie in kids:
 
449
                child_path = os.path.join(dir_path, name)
 
450
                accum.append((child_path, ie))
 
451
                if ie.kind == 'directory':
 
452
                    descend(ie, child_path)
 
453
 
 
454
        descend(self.root, '')
 
455
        return accum
 
456
 
 
457
 
 
458
    def directories(self):
 
459
        """Return (path, entry) pairs for all directories, including the root.
 
460
        """
 
461
        accum = []
 
462
        def descend(parent_ie, parent_path):
 
463
            accum.append((parent_path, parent_ie))
 
464
            
 
465
            kids = [(ie.name, ie) for ie in parent_ie.children.itervalues() if ie.kind == 'directory']
 
466
            kids.sort()
 
467
 
 
468
            for name, child_ie in kids:
 
469
                child_path = os.path.join(parent_path, name)
 
470
                descend(child_ie, child_path)
 
471
        descend(self.root, '')
 
472
        return accum
 
473
        
 
474
 
 
475
 
 
476
    def __contains__(self, file_id):
 
477
        """True if this entry contains a file with given id.
 
478
 
 
479
        >>> inv = Inventory()
 
480
        >>> inv.add(InventoryEntry('123', 'foo.c', 'file', ROOT_ID))
 
481
        InventoryEntry('123', 'foo.c', kind='file', parent_id='TREE_ROOT')
 
482
        >>> '123' in inv
 
483
        True
 
484
        >>> '456' in inv
 
485
        False
 
486
        """
 
487
        return file_id in self._byid
 
488
 
 
489
 
 
490
    def __getitem__(self, file_id):
 
491
        """Return the entry for given file_id.
 
492
 
 
493
        >>> inv = Inventory()
 
494
        >>> inv.add(InventoryEntry('123123', 'hello.c', 'file', ROOT_ID))
 
495
        InventoryEntry('123123', 'hello.c', kind='file', parent_id='TREE_ROOT')
 
496
        >>> inv['123123'].name
 
497
        'hello.c'
 
498
        """
 
499
        try:
 
500
            return self._byid[file_id]
 
501
        except KeyError:
 
502
            if file_id == None:
 
503
                raise BzrError("can't look up file_id None")
 
504
            else:
 
505
                raise BzrError("file_id {%s} not in inventory" % file_id)
 
506
 
 
507
 
 
508
    def get_file_kind(self, file_id):
 
509
        return self._byid[file_id].kind
 
510
 
 
511
    def get_child(self, parent_id, filename):
 
512
        return self[parent_id].children.get(filename)
 
513
 
 
514
 
 
515
    def add(self, entry):
 
516
        """Add entry to inventory.
 
517
 
 
518
        To add  a file to a branch ready to be committed, use Branch.add,
 
519
        which calls this.
 
520
 
 
521
        Returns the new entry object.
 
522
        """
 
523
        if entry.file_id in self._byid:
 
524
            raise BzrError("inventory already contains entry with id {%s}" % entry.file_id)
 
525
 
 
526
        if entry.parent_id == ROOT_ID or entry.parent_id is None:
 
527
            entry.parent_id = self.root.file_id
 
528
 
 
529
        try:
 
530
            parent = self._byid[entry.parent_id]
 
531
        except KeyError:
 
532
            raise BzrError("parent_id {%s} not in inventory" % entry.parent_id)
 
533
 
 
534
        if parent.children.has_key(entry.name):
 
535
            raise BzrError("%s is already versioned" %
 
536
                    appendpath(self.id2path(parent.file_id), entry.name))
 
537
 
 
538
        self._byid[entry.file_id] = entry
 
539
        parent.children[entry.name] = entry
 
540
        return entry
 
541
 
 
542
 
 
543
    def add_path(self, relpath, kind, file_id=None):
 
544
        """Add entry from a path.
 
545
 
 
546
        The immediate parent must already be versioned.
 
547
 
 
548
        Returns the new entry object."""
 
549
        from bzrlib.branch import gen_file_id
 
550
        
 
551
        parts = bzrlib.osutils.splitpath(relpath)
 
552
        if len(parts) == 0:
 
553
            raise BzrError("cannot re-add root of inventory")
 
554
 
 
555
        if file_id == None:
 
556
            file_id = gen_file_id(relpath)
 
557
 
 
558
        parent_path = parts[:-1]
 
559
        parent_id = self.path2id(parent_path)
 
560
        if parent_id == None:
 
561
            raise NotVersionedError(parent_path)
 
562
 
 
563
        ie = InventoryEntry(file_id, parts[-1],
 
564
                            kind=kind, parent_id=parent_id)
 
565
        return self.add(ie)
 
566
 
 
567
 
 
568
    def __delitem__(self, file_id):
 
569
        """Remove entry by id.
 
570
 
 
571
        >>> inv = Inventory()
 
572
        >>> inv.add(InventoryEntry('123', 'foo.c', 'file', ROOT_ID))
 
573
        InventoryEntry('123', 'foo.c', kind='file', parent_id='TREE_ROOT')
 
574
        >>> '123' in inv
 
575
        True
 
576
        >>> del inv['123']
 
577
        >>> '123' in inv
 
578
        False
 
579
        """
 
580
        ie = self[file_id]
 
581
 
 
582
        assert self[ie.parent_id].children[ie.name] == ie
 
583
        
 
584
        # TODO: Test deleting all children; maybe hoist to a separate
 
585
        # deltree method?
 
586
        if ie.kind == 'directory':
 
587
            for cie in ie.children.values():
 
588
                del self[cie.file_id]
 
589
            del ie.children
 
590
 
 
591
        del self._byid[file_id]
 
592
        del self[ie.parent_id].children[ie.name]
 
593
 
 
594
 
 
595
    def __eq__(self, other):
 
596
        """Compare two sets by comparing their contents.
 
597
 
 
598
        >>> i1 = Inventory()
 
599
        >>> i2 = Inventory()
 
600
        >>> i1 == i2
 
601
        True
 
602
        >>> i1.add(InventoryEntry('123', 'foo', 'file', ROOT_ID))
 
603
        InventoryEntry('123', 'foo', kind='file', parent_id='TREE_ROOT')
 
604
        >>> i1 == i2
 
605
        False
 
606
        >>> i2.add(InventoryEntry('123', 'foo', 'file', ROOT_ID))
 
607
        InventoryEntry('123', 'foo', kind='file', parent_id='TREE_ROOT')
 
608
        >>> i1 == i2
 
609
        True
 
610
        """
 
611
        if not isinstance(other, Inventory):
 
612
            return NotImplemented
 
613
 
 
614
        if len(self._byid) != len(other._byid):
 
615
            # shortcut: obviously not the same
 
616
            return False
 
617
 
 
618
        return self._byid == other._byid
 
619
 
 
620
 
 
621
    def __ne__(self, other):
 
622
        return not self.__eq__(other)
 
623
 
 
624
 
 
625
    def __hash__(self):
 
626
        raise ValueError('not hashable')
 
627
 
 
628
 
 
629
    def get_idpath(self, file_id):
 
630
        """Return a list of file_ids for the path to an entry.
 
631
 
 
632
        The list contains one element for each directory followed by
 
633
        the id of the file itself.  So the length of the returned list
 
634
        is equal to the depth of the file in the tree, counting the
 
635
        root directory as depth 1.
 
636
        """
 
637
        p = []
 
638
        while file_id != None:
 
639
            try:
 
640
                ie = self._byid[file_id]
 
641
            except KeyError:
 
642
                raise BzrError("file_id {%s} not found in inventory" % file_id)
 
643
            p.insert(0, ie.file_id)
 
644
            file_id = ie.parent_id
 
645
        return p
 
646
 
 
647
 
 
648
    def id2path(self, file_id):
 
649
        """Return as a list the path to file_id."""
 
650
 
 
651
        # get all names, skipping root
 
652
        p = [self._byid[fid].name for fid in self.get_idpath(file_id)[1:]]
 
653
        return os.sep.join(p)
 
654
            
 
655
 
 
656
 
 
657
    def path2id(self, name):
 
658
        """Walk down through directories to return entry of last component.
 
659
 
 
660
        names may be either a list of path components, or a single
 
661
        string, in which case it is automatically split.
 
662
 
 
663
        This returns the entry of the last component in the path,
 
664
        which may be either a file or a directory.
 
665
 
 
666
        Returns None iff the path is not found.
 
667
        """
 
668
        if isinstance(name, types.StringTypes):
 
669
            name = splitpath(name)
 
670
 
 
671
        mutter("lookup path %r" % name)
 
672
 
 
673
        parent = self.root
 
674
        for f in name:
 
675
            try:
 
676
                cie = parent.children[f]
 
677
                assert cie.name == f
 
678
                assert cie.parent_id == parent.file_id
 
679
                parent = cie
 
680
            except KeyError:
 
681
                # or raise an error?
 
682
                return None
 
683
 
 
684
        return parent.file_id
 
685
 
 
686
 
 
687
    def has_filename(self, names):
 
688
        return bool(self.path2id(names))
 
689
 
 
690
 
 
691
    def has_id(self, file_id):
 
692
        return self._byid.has_key(file_id)
 
693
 
 
694
 
 
695
    def rename(self, file_id, new_parent_id, new_name):
 
696
        """Move a file within the inventory.
 
697
 
 
698
        This can change either the name, or the parent, or both.
 
699
 
 
700
        This does not move the working file."""
 
701
        if not is_valid_name(new_name):
 
702
            raise BzrError("not an acceptable filename: %r" % new_name)
 
703
 
 
704
        new_parent = self._byid[new_parent_id]
 
705
        if new_name in new_parent.children:
 
706
            raise BzrError("%r already exists in %r" % (new_name, self.id2path(new_parent_id)))
 
707
 
 
708
        new_parent_idpath = self.get_idpath(new_parent_id)
 
709
        if file_id in new_parent_idpath:
 
710
            raise BzrError("cannot move directory %r into a subdirectory of itself, %r"
 
711
                    % (self.id2path(file_id), self.id2path(new_parent_id)))
 
712
 
 
713
        file_ie = self._byid[file_id]
 
714
        old_parent = self._byid[file_ie.parent_id]
 
715
 
 
716
        # TODO: Don't leave things messed up if this fails
 
717
 
 
718
        del old_parent.children[file_ie.name]
 
719
        new_parent.children[new_name] = file_ie
 
720
        
 
721
        file_ie.name = new_name
 
722
        file_ie.parent_id = new_parent_id
 
723
 
 
724
 
 
725
 
 
726
 
 
727
_NAME_RE = None
 
728
 
 
729
def is_valid_name(name):
 
730
    global _NAME_RE
 
731
    if _NAME_RE == None:
 
732
        _NAME_RE = re.compile(r'^[^/\\]+$')
 
733
        
 
734
    return bool(_NAME_RE.match(name))