/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/log.py

  • Committer: Robert Collins
  • Date: 2010-02-28 10:08:29 UTC
  • mto: This revision was merged to the branch mainline in revision 5062.
  • Revision ID: robertc@robertcollins.net-20100228100829-nroa3qp8zi8jwxke
* bzr now has a ``.testr.conf`` file in its source tree configured
  appropriately for running tests with Testrepository
  (``https://launchpad.net/testrepository``). (Robert Collins)

* Documentation about testing with ``subunit`` has been tweaked.
  (Robert Collins)

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005-2010 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
16
 
 
17
 
 
18
 
 
19
"""Code to show logs of changes.
 
20
 
 
21
Various flavors of log can be produced:
 
22
 
 
23
* for one file, or the whole tree, and (not done yet) for
 
24
  files in a given directory
 
25
 
 
26
* in "verbose" mode with a description of what changed from one
 
27
  version to the next
 
28
 
 
29
* with file-ids and revision-ids shown
 
30
 
 
31
Logs are actually written out through an abstract LogFormatter
 
32
interface, which allows for different preferred formats.  Plugins can
 
33
register formats too.
 
34
 
 
35
Logs can be produced in either forward (oldest->newest) or reverse
 
36
(newest->oldest) order.
 
37
 
 
38
Logs can be filtered to show only revisions matching a particular
 
39
search string, or within a particular range of revisions.  The range
 
40
can be given as date/times, which are reduced to revisions before
 
41
calling in here.
 
42
 
 
43
In verbose mode we show a summary of what changed in each particular
 
44
revision.  Note that this is the delta for changes in that revision
 
45
relative to its left-most parent, not the delta relative to the last
 
46
logged revision.  So for example if you ask for a verbose log of
 
47
changes touching hello.c you will get a list of those revisions also
 
48
listing other things that were changed in the same revision, but not
 
49
all the changes since the previous revision that touched hello.c.
 
50
"""
 
51
 
 
52
import codecs
 
53
from cStringIO import StringIO
 
54
from itertools import (
 
55
    chain,
 
56
    izip,
 
57
    )
 
58
import re
 
59
import sys
 
60
from warnings import (
 
61
    warn,
 
62
    )
 
63
 
 
64
from bzrlib.lazy_import import lazy_import
 
65
lazy_import(globals(), """
 
66
 
 
67
from bzrlib import (
 
68
    bzrdir,
 
69
    config,
 
70
    diff,
 
71
    errors,
 
72
    foreign,
 
73
    repository as _mod_repository,
 
74
    revision as _mod_revision,
 
75
    revisionspec,
 
76
    trace,
 
77
    tsort,
 
78
    )
 
79
""")
 
80
 
 
81
from bzrlib import (
 
82
    registry,
 
83
    )
 
84
from bzrlib.osutils import (
 
85
    format_date,
 
86
    format_date_with_offset_in_original_timezone,
 
87
    get_terminal_encoding,
 
88
    re_compile_checked,
 
89
    terminal_width,
 
90
    )
 
91
from bzrlib.symbol_versioning import (
 
92
    deprecated_function,
 
93
    deprecated_in,
 
94
    )
 
95
 
 
96
 
 
97
def find_touching_revisions(branch, file_id):
 
98
    """Yield a description of revisions which affect the file_id.
 
99
 
 
100
    Each returned element is (revno, revision_id, description)
 
101
 
 
102
    This is the list of revisions where the file is either added,
 
103
    modified, renamed or deleted.
 
104
 
 
105
    TODO: Perhaps some way to limit this to only particular revisions,
 
106
    or to traverse a non-mainline set of revisions?
 
107
    """
 
108
    last_ie = None
 
109
    last_path = None
 
110
    revno = 1
 
111
    for revision_id in branch.revision_history():
 
112
        this_inv = branch.repository.get_inventory(revision_id)
 
113
        if file_id in this_inv:
 
114
            this_ie = this_inv[file_id]
 
115
            this_path = this_inv.id2path(file_id)
 
116
        else:
 
117
            this_ie = this_path = None
 
118
 
 
119
        # now we know how it was last time, and how it is in this revision.
 
120
        # are those two states effectively the same or not?
 
121
 
 
122
        if not this_ie and not last_ie:
 
123
            # not present in either
 
124
            pass
 
125
        elif this_ie and not last_ie:
 
126
            yield revno, revision_id, "added " + this_path
 
127
        elif not this_ie and last_ie:
 
128
            # deleted here
 
129
            yield revno, revision_id, "deleted " + last_path
 
130
        elif this_path != last_path:
 
131
            yield revno, revision_id, ("renamed %s => %s" % (last_path, this_path))
 
132
        elif (this_ie.text_size != last_ie.text_size
 
133
              or this_ie.text_sha1 != last_ie.text_sha1):
 
134
            yield revno, revision_id, "modified " + this_path
 
135
 
 
136
        last_ie = this_ie
 
137
        last_path = this_path
 
138
        revno += 1
 
139
 
 
140
 
 
141
def _enumerate_history(branch):
 
142
    rh = []
 
143
    revno = 1
 
144
    for rev_id in branch.revision_history():
 
145
        rh.append((revno, rev_id))
 
146
        revno += 1
 
147
    return rh
 
148
 
 
149
 
 
150
def show_log(branch,
 
151
             lf,
 
152
             specific_fileid=None,
 
153
             verbose=False,
 
154
             direction='reverse',
 
155
             start_revision=None,
 
156
             end_revision=None,
 
157
             search=None,
 
158
             limit=None,
 
159
             show_diff=False):
 
160
    """Write out human-readable log of commits to this branch.
 
161
 
 
162
    This function is being retained for backwards compatibility but
 
163
    should not be extended with new parameters. Use the new Logger class
 
164
    instead, eg. Logger(branch, rqst).show(lf), adding parameters to the
 
165
    make_log_request_dict function.
 
166
 
 
167
    :param lf: The LogFormatter object showing the output.
 
168
 
 
169
    :param specific_fileid: If not None, list only the commits affecting the
 
170
        specified file, rather than all commits.
 
171
 
 
172
    :param verbose: If True show added/changed/deleted/renamed files.
 
173
 
 
174
    :param direction: 'reverse' (default) is latest to earliest; 'forward' is
 
175
        earliest to latest.
 
176
 
 
177
    :param start_revision: If not None, only show revisions >= start_revision
 
178
 
 
179
    :param end_revision: If not None, only show revisions <= end_revision
 
180
 
 
181
    :param search: If not None, only show revisions with matching commit
 
182
        messages
 
183
 
 
184
    :param limit: If set, shows only 'limit' revisions, all revisions are shown
 
185
        if None or 0.
 
186
 
 
187
    :param show_diff: If True, output a diff after each revision.
 
188
    """
 
189
    # Convert old-style parameters to new-style parameters
 
190
    if specific_fileid is not None:
 
191
        file_ids = [specific_fileid]
 
192
    else:
 
193
        file_ids = None
 
194
    if verbose:
 
195
        if file_ids:
 
196
            delta_type = 'partial'
 
197
        else:
 
198
            delta_type = 'full'
 
199
    else:
 
200
        delta_type = None
 
201
    if show_diff:
 
202
        if file_ids:
 
203
            diff_type = 'partial'
 
204
        else:
 
205
            diff_type = 'full'
 
206
    else:
 
207
        diff_type = None
 
208
 
 
209
    # Build the request and execute it
 
210
    rqst = make_log_request_dict(direction=direction, specific_fileids=file_ids,
 
211
        start_revision=start_revision, end_revision=end_revision,
 
212
        limit=limit, message_search=search,
 
213
        delta_type=delta_type, diff_type=diff_type)
 
214
    Logger(branch, rqst).show(lf)
 
215
 
 
216
 
 
217
# Note: This needs to be kept this in sync with the defaults in
 
218
# make_log_request_dict() below
 
219
_DEFAULT_REQUEST_PARAMS = {
 
220
    'direction': 'reverse',
 
221
    'levels': 1,
 
222
    'generate_tags': True,
 
223
    '_match_using_deltas': True,
 
224
    }
 
225
 
 
226
 
 
227
def make_log_request_dict(direction='reverse', specific_fileids=None,
 
228
    start_revision=None, end_revision=None, limit=None,
 
229
    message_search=None, levels=1, generate_tags=True, delta_type=None,
 
230
    diff_type=None, _match_using_deltas=True):
 
231
    """Convenience function for making a logging request dictionary.
 
232
 
 
233
    Using this function may make code slightly safer by ensuring
 
234
    parameters have the correct names. It also provides a reference
 
235
    point for documenting the supported parameters.
 
236
 
 
237
    :param direction: 'reverse' (default) is latest to earliest;
 
238
      'forward' is earliest to latest.
 
239
 
 
240
    :param specific_fileids: If not None, only include revisions
 
241
      affecting the specified files, rather than all revisions.
 
242
 
 
243
    :param start_revision: If not None, only generate
 
244
      revisions >= start_revision
 
245
 
 
246
    :param end_revision: If not None, only generate
 
247
      revisions <= end_revision
 
248
 
 
249
    :param limit: If set, generate only 'limit' revisions, all revisions
 
250
      are shown if None or 0.
 
251
 
 
252
    :param message_search: If not None, only include revisions with
 
253
      matching commit messages
 
254
 
 
255
    :param levels: the number of levels of revisions to
 
256
      generate; 1 for just the mainline; 0 for all levels.
 
257
 
 
258
    :param generate_tags: If True, include tags for matched revisions.
 
259
 
 
260
    :param delta_type: Either 'full', 'partial' or None.
 
261
      'full' means generate the complete delta - adds/deletes/modifies/etc;
 
262
      'partial' means filter the delta using specific_fileids;
 
263
      None means do not generate any delta.
 
264
 
 
265
    :param diff_type: Either 'full', 'partial' or None.
 
266
      'full' means generate the complete diff - adds/deletes/modifies/etc;
 
267
      'partial' means filter the diff using specific_fileids;
 
268
      None means do not generate any diff.
 
269
 
 
270
    :param _match_using_deltas: a private parameter controlling the
 
271
      algorithm used for matching specific_fileids. This parameter
 
272
      may be removed in the future so bzrlib client code should NOT
 
273
      use it.
 
274
    """
 
275
    return {
 
276
        'direction': direction,
 
277
        'specific_fileids': specific_fileids,
 
278
        'start_revision': start_revision,
 
279
        'end_revision': end_revision,
 
280
        'limit': limit,
 
281
        'message_search': message_search,
 
282
        'levels': levels,
 
283
        'generate_tags': generate_tags,
 
284
        'delta_type': delta_type,
 
285
        'diff_type': diff_type,
 
286
        # Add 'private' attributes for features that may be deprecated
 
287
        '_match_using_deltas': _match_using_deltas,
 
288
    }
 
289
 
 
290
 
 
291
def _apply_log_request_defaults(rqst):
 
292
    """Apply default values to a request dictionary."""
 
293
    result = _DEFAULT_REQUEST_PARAMS
 
294
    if rqst:
 
295
        result.update(rqst)
 
296
    return result
 
297
 
 
298
 
 
299
class LogGenerator(object):
 
300
    """A generator of log revisions."""
 
301
 
 
302
    def iter_log_revisions(self):
 
303
        """Iterate over LogRevision objects.
 
304
 
 
305
        :return: An iterator yielding LogRevision objects.
 
306
        """
 
307
        raise NotImplementedError(self.iter_log_revisions)
 
308
 
 
309
 
 
310
class Logger(object):
 
311
    """An object that generates, formats and displays a log."""
 
312
 
 
313
    def __init__(self, branch, rqst):
 
314
        """Create a Logger.
 
315
 
 
316
        :param branch: the branch to log
 
317
        :param rqst: A dictionary specifying the query parameters.
 
318
          See make_log_request_dict() for supported values.
 
319
        """
 
320
        self.branch = branch
 
321
        self.rqst = _apply_log_request_defaults(rqst)
 
322
 
 
323
    def show(self, lf):
 
324
        """Display the log.
 
325
 
 
326
        :param lf: The LogFormatter object to send the output to.
 
327
        """
 
328
        if not isinstance(lf, LogFormatter):
 
329
            warn("not a LogFormatter instance: %r" % lf)
 
330
 
 
331
        self.branch.lock_read()
 
332
        try:
 
333
            if getattr(lf, 'begin_log', None):
 
334
                lf.begin_log()
 
335
            self._show_body(lf)
 
336
            if getattr(lf, 'end_log', None):
 
337
                lf.end_log()
 
338
        finally:
 
339
            self.branch.unlock()
 
340
 
 
341
    def _show_body(self, lf):
 
342
        """Show the main log output.
 
343
 
 
344
        Subclasses may wish to override this.
 
345
        """
 
346
        # Tweak the LogRequest based on what the LogFormatter can handle.
 
347
        # (There's no point generating stuff if the formatter can't display it.)
 
348
        rqst = self.rqst
 
349
        rqst['levels'] = lf.get_levels()
 
350
        if not getattr(lf, 'supports_tags', False):
 
351
            rqst['generate_tags'] = False
 
352
        if not getattr(lf, 'supports_delta', False):
 
353
            rqst['delta_type'] = None
 
354
        if not getattr(lf, 'supports_diff', False):
 
355
            rqst['diff_type'] = None
 
356
 
 
357
        # Find and print the interesting revisions
 
358
        generator = self._generator_factory(self.branch, rqst)
 
359
        for lr in generator.iter_log_revisions():
 
360
            lf.log_revision(lr)
 
361
        lf.show_advice()
 
362
 
 
363
    def _generator_factory(self, branch, rqst):
 
364
        """Make the LogGenerator object to use.
 
365
        
 
366
        Subclasses may wish to override this.
 
367
        """
 
368
        return _DefaultLogGenerator(branch, rqst)
 
369
 
 
370
 
 
371
class _StartNotLinearAncestor(Exception):
 
372
    """Raised when a start revision is not found walking left-hand history."""
 
373
 
 
374
 
 
375
class _DefaultLogGenerator(LogGenerator):
 
376
    """The default generator of log revisions."""
 
377
 
 
378
    def __init__(self, branch, rqst):
 
379
        self.branch = branch
 
380
        self.rqst = rqst
 
381
        if rqst.get('generate_tags') and branch.supports_tags():
 
382
            self.rev_tag_dict = branch.tags.get_reverse_tag_dict()
 
383
        else:
 
384
            self.rev_tag_dict = {}
 
385
 
 
386
    def iter_log_revisions(self):
 
387
        """Iterate over LogRevision objects.
 
388
 
 
389
        :return: An iterator yielding LogRevision objects.
 
390
        """
 
391
        rqst = self.rqst
 
392
        levels = rqst.get('levels')
 
393
        limit = rqst.get('limit')
 
394
        diff_type = rqst.get('diff_type')
 
395
        log_count = 0
 
396
        revision_iterator = self._create_log_revision_iterator()
 
397
        for revs in revision_iterator:
 
398
            for (rev_id, revno, merge_depth), rev, delta in revs:
 
399
                # 0 levels means show everything; merge_depth counts from 0
 
400
                if levels != 0 and merge_depth >= levels:
 
401
                    continue
 
402
                if diff_type is None:
 
403
                    diff = None
 
404
                else:
 
405
                    diff = self._format_diff(rev, rev_id, diff_type)
 
406
                yield LogRevision(rev, revno, merge_depth, delta,
 
407
                    self.rev_tag_dict.get(rev_id), diff)
 
408
                if limit:
 
409
                    log_count += 1
 
410
                    if log_count >= limit:
 
411
                        return
 
412
 
 
413
    def _format_diff(self, rev, rev_id, diff_type):
 
414
        repo = self.branch.repository
 
415
        if len(rev.parent_ids) == 0:
 
416
            ancestor_id = _mod_revision.NULL_REVISION
 
417
        else:
 
418
            ancestor_id = rev.parent_ids[0]
 
419
        tree_1 = repo.revision_tree(ancestor_id)
 
420
        tree_2 = repo.revision_tree(rev_id)
 
421
        file_ids = self.rqst.get('specific_fileids')
 
422
        if diff_type == 'partial' and file_ids is not None:
 
423
            specific_files = [tree_2.id2path(id) for id in file_ids]
 
424
        else:
 
425
            specific_files = None
 
426
        s = StringIO()
 
427
        diff.show_diff_trees(tree_1, tree_2, s, specific_files, old_label='',
 
428
            new_label='')
 
429
        return s.getvalue()
 
430
 
 
431
    def _create_log_revision_iterator(self):
 
432
        """Create a revision iterator for log.
 
433
 
 
434
        :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
435
            delta).
 
436
        """
 
437
        self.start_rev_id, self.end_rev_id = _get_revision_limits(
 
438
            self.branch, self.rqst.get('start_revision'),
 
439
            self.rqst.get('end_revision'))
 
440
        if self.rqst.get('_match_using_deltas'):
 
441
            return self._log_revision_iterator_using_delta_matching()
 
442
        else:
 
443
            # We're using the per-file-graph algorithm. This scales really
 
444
            # well but only makes sense if there is a single file and it's
 
445
            # not a directory
 
446
            file_count = len(self.rqst.get('specific_fileids'))
 
447
            if file_count != 1:
 
448
                raise BzrError("illegal LogRequest: must match-using-deltas "
 
449
                    "when logging %d files" % file_count)
 
450
            return self._log_revision_iterator_using_per_file_graph()
 
451
 
 
452
    def _log_revision_iterator_using_delta_matching(self):
 
453
        # Get the base revisions, filtering by the revision range
 
454
        rqst = self.rqst
 
455
        generate_merge_revisions = rqst.get('levels') != 1
 
456
        delayed_graph_generation = not rqst.get('specific_fileids') and (
 
457
                rqst.get('limit') or self.start_rev_id or self.end_rev_id)
 
458
        view_revisions = _calc_view_revisions(self.branch, self.start_rev_id,
 
459
            self.end_rev_id, rqst.get('direction'), generate_merge_revisions,
 
460
            delayed_graph_generation=delayed_graph_generation)
 
461
 
 
462
        # Apply the other filters
 
463
        return make_log_rev_iterator(self.branch, view_revisions,
 
464
            rqst.get('delta_type'), rqst.get('message_search'),
 
465
            file_ids=rqst.get('specific_fileids'),
 
466
            direction=rqst.get('direction'))
 
467
 
 
468
    def _log_revision_iterator_using_per_file_graph(self):
 
469
        # Get the base revisions, filtering by the revision range.
 
470
        # Note that we always generate the merge revisions because
 
471
        # filter_revisions_touching_file_id() requires them ...
 
472
        rqst = self.rqst
 
473
        view_revisions = _calc_view_revisions(self.branch, self.start_rev_id,
 
474
            self.end_rev_id, rqst.get('direction'), True)
 
475
        if not isinstance(view_revisions, list):
 
476
            view_revisions = list(view_revisions)
 
477
        view_revisions = _filter_revisions_touching_file_id(self.branch,
 
478
            rqst.get('specific_fileids')[0], view_revisions,
 
479
            include_merges=rqst.get('levels') != 1)
 
480
        return make_log_rev_iterator(self.branch, view_revisions,
 
481
            rqst.get('delta_type'), rqst.get('message_search'))
 
482
 
 
483
 
 
484
def _calc_view_revisions(branch, start_rev_id, end_rev_id, direction,
 
485
    generate_merge_revisions, delayed_graph_generation=False):
 
486
    """Calculate the revisions to view.
 
487
 
 
488
    :return: An iterator of (revision_id, dotted_revno, merge_depth) tuples OR
 
489
             a list of the same tuples.
 
490
    """
 
491
    br_revno, br_rev_id = branch.last_revision_info()
 
492
    if br_revno == 0:
 
493
        return []
 
494
 
 
495
    # If a single revision is requested, check we can handle it
 
496
    generate_single_revision = (end_rev_id and start_rev_id == end_rev_id and
 
497
        (not generate_merge_revisions or not _has_merges(branch, end_rev_id)))
 
498
    if generate_single_revision:
 
499
        return _generate_one_revision(branch, end_rev_id, br_rev_id, br_revno)
 
500
 
 
501
    # If we only want to see linear revisions, we can iterate ...
 
502
    if not generate_merge_revisions:
 
503
        return _generate_flat_revisions(branch, start_rev_id, end_rev_id,
 
504
            direction)
 
505
    else:
 
506
        return _generate_all_revisions(branch, start_rev_id, end_rev_id,
 
507
            direction, delayed_graph_generation)
 
508
 
 
509
 
 
510
def _generate_one_revision(branch, rev_id, br_rev_id, br_revno):
 
511
    if rev_id == br_rev_id:
 
512
        # It's the tip
 
513
        return [(br_rev_id, br_revno, 0)]
 
514
    else:
 
515
        revno = branch.revision_id_to_dotted_revno(rev_id)
 
516
        revno_str = '.'.join(str(n) for n in revno)
 
517
        return [(rev_id, revno_str, 0)]
 
518
 
 
519
 
 
520
def _generate_flat_revisions(branch, start_rev_id, end_rev_id, direction):
 
521
    result = _linear_view_revisions(branch, start_rev_id, end_rev_id)
 
522
    # If a start limit was given and it's not obviously an
 
523
    # ancestor of the end limit, check it before outputting anything
 
524
    if direction == 'forward' or (start_rev_id
 
525
        and not _is_obvious_ancestor(branch, start_rev_id, end_rev_id)):
 
526
        try:
 
527
            result = list(result)
 
528
        except _StartNotLinearAncestor:
 
529
            raise errors.BzrCommandError('Start revision not found in'
 
530
                ' left-hand history of end revision.')
 
531
    if direction == 'forward':
 
532
        result = reversed(result)
 
533
    return result
 
534
 
 
535
 
 
536
def _generate_all_revisions(branch, start_rev_id, end_rev_id, direction,
 
537
                            delayed_graph_generation):
 
538
    # On large trees, generating the merge graph can take 30-60 seconds
 
539
    # so we delay doing it until a merge is detected, incrementally
 
540
    # returning initial (non-merge) revisions while we can.
 
541
 
 
542
    # The above is only true for old formats (<= 0.92), for newer formats, a
 
543
    # couple of seconds only should be needed to load the whole graph and the
 
544
    # other graph operations needed are even faster than that -- vila 100201
 
545
    initial_revisions = []
 
546
    if delayed_graph_generation:
 
547
        try:
 
548
            for rev_id, revno, depth in  _linear_view_revisions(
 
549
                branch, start_rev_id, end_rev_id):
 
550
                if _has_merges(branch, rev_id):
 
551
                    # The end_rev_id can be nested down somewhere. We need an
 
552
                    # explicit ancestry check. There is an ambiguity here as we
 
553
                    # may not raise _StartNotLinearAncestor for a revision that
 
554
                    # is an ancestor but not a *linear* one. But since we have
 
555
                    # loaded the graph to do the check (or calculate a dotted
 
556
                    # revno), we may as well accept to show the log... 
 
557
                    # -- vila 100201
 
558
                    graph = branch.repository.get_graph()
 
559
                    if not graph.is_ancestor(start_rev_id, end_rev_id):
 
560
                        raise _StartNotLinearAncestor()
 
561
                    end_rev_id = rev_id
 
562
                    break
 
563
                else:
 
564
                    initial_revisions.append((rev_id, revno, depth))
 
565
            else:
 
566
                # No merged revisions found
 
567
                if direction == 'reverse':
 
568
                    return initial_revisions
 
569
                elif direction == 'forward':
 
570
                    return reversed(initial_revisions)
 
571
                else:
 
572
                    raise ValueError('invalid direction %r' % direction)
 
573
        except _StartNotLinearAncestor:
 
574
            # A merge was never detected so the lower revision limit can't
 
575
            # be nested down somewhere
 
576
            raise errors.BzrCommandError('Start revision not found in'
 
577
                ' history of end revision.')
 
578
 
 
579
    # A log including nested merges is required. If the direction is reverse,
 
580
    # we rebase the initial merge depths so that the development line is
 
581
    # shown naturally, i.e. just like it is for linear logging. We can easily
 
582
    # make forward the exact opposite display, but showing the merge revisions
 
583
    # indented at the end seems slightly nicer in that case.
 
584
    view_revisions = chain(iter(initial_revisions),
 
585
        _graph_view_revisions(branch, start_rev_id, end_rev_id,
 
586
        rebase_initial_depths=direction == 'reverse'))
 
587
    if direction == 'reverse':
 
588
        return view_revisions
 
589
    elif direction == 'forward':
 
590
        # Forward means oldest first, adjusting for depth.
 
591
        view_revisions = reverse_by_depth(list(view_revisions))
 
592
        return _rebase_merge_depth(view_revisions)
 
593
    else:
 
594
        raise ValueError('invalid direction %r' % direction)
 
595
 
 
596
 
 
597
def _has_merges(branch, rev_id):
 
598
    """Does a revision have multiple parents or not?"""
 
599
    parents = branch.repository.get_parent_map([rev_id]).get(rev_id, [])
 
600
    return len(parents) > 1
 
601
 
 
602
 
 
603
def _is_obvious_ancestor(branch, start_rev_id, end_rev_id):
 
604
    """Is start_rev_id an obvious ancestor of end_rev_id?"""
 
605
    if start_rev_id and end_rev_id:
 
606
        start_dotted = branch.revision_id_to_dotted_revno(start_rev_id)
 
607
        end_dotted = branch.revision_id_to_dotted_revno(end_rev_id)
 
608
        if len(start_dotted) == 1 and len(end_dotted) == 1:
 
609
            # both on mainline
 
610
            return start_dotted[0] <= end_dotted[0]
 
611
        elif (len(start_dotted) == 3 and len(end_dotted) == 3 and
 
612
            start_dotted[0:1] == end_dotted[0:1]):
 
613
            # both on same development line
 
614
            return start_dotted[2] <= end_dotted[2]
 
615
        else:
 
616
            # not obvious
 
617
            return False
 
618
    # if either start or end is not specified then we use either the first or
 
619
    # the last revision and *they* are obvious ancestors.
 
620
    return True
 
621
 
 
622
 
 
623
def _linear_view_revisions(branch, start_rev_id, end_rev_id):
 
624
    """Calculate a sequence of revisions to view, newest to oldest.
 
625
 
 
626
    :param start_rev_id: the lower revision-id
 
627
    :param end_rev_id: the upper revision-id
 
628
    :return: An iterator of (revision_id, dotted_revno, merge_depth) tuples.
 
629
    :raises _StartNotLinearAncestor: if a start_rev_id is specified but
 
630
      is not found walking the left-hand history
 
631
    """
 
632
    br_revno, br_rev_id = branch.last_revision_info()
 
633
    repo = branch.repository
 
634
    if start_rev_id is None and end_rev_id is None:
 
635
        cur_revno = br_revno
 
636
        for revision_id in repo.iter_reverse_revision_history(br_rev_id):
 
637
            yield revision_id, str(cur_revno), 0
 
638
            cur_revno -= 1
 
639
    else:
 
640
        if end_rev_id is None:
 
641
            end_rev_id = br_rev_id
 
642
        found_start = start_rev_id is None
 
643
        for revision_id in repo.iter_reverse_revision_history(end_rev_id):
 
644
            revno = branch.revision_id_to_dotted_revno(revision_id)
 
645
            revno_str = '.'.join(str(n) for n in revno)
 
646
            if not found_start and revision_id == start_rev_id:
 
647
                yield revision_id, revno_str, 0
 
648
                found_start = True
 
649
                break
 
650
            else:
 
651
                yield revision_id, revno_str, 0
 
652
        else:
 
653
            if not found_start:
 
654
                raise _StartNotLinearAncestor()
 
655
 
 
656
 
 
657
def _graph_view_revisions(branch, start_rev_id, end_rev_id,
 
658
    rebase_initial_depths=True):
 
659
    """Calculate revisions to view including merges, newest to oldest.
 
660
 
 
661
    :param branch: the branch
 
662
    :param start_rev_id: the lower revision-id
 
663
    :param end_rev_id: the upper revision-id
 
664
    :param rebase_initial_depth: should depths be rebased until a mainline
 
665
      revision is found?
 
666
    :return: An iterator of (revision_id, dotted_revno, merge_depth) tuples.
 
667
    """
 
668
    view_revisions = branch.iter_merge_sorted_revisions(
 
669
        start_revision_id=end_rev_id, stop_revision_id=start_rev_id,
 
670
        stop_rule="with-merges")
 
671
    if not rebase_initial_depths:
 
672
        for (rev_id, merge_depth, revno, end_of_merge
 
673
             ) in view_revisions:
 
674
            yield rev_id, '.'.join(map(str, revno)), merge_depth
 
675
    else:
 
676
        # We're following a development line starting at a merged revision.
 
677
        # We need to adjust depths down by the initial depth until we find
 
678
        # a depth less than it. Then we use that depth as the adjustment.
 
679
        # If and when we reach the mainline, depth adjustment ends.
 
680
        depth_adjustment = None
 
681
        for (rev_id, merge_depth, revno, end_of_merge
 
682
             ) in view_revisions:
 
683
            if depth_adjustment is None:
 
684
                depth_adjustment = merge_depth
 
685
            if depth_adjustment:
 
686
                if merge_depth < depth_adjustment:
 
687
                    # From now on we reduce the depth adjustement, this can be
 
688
                    # surprising for users. The alternative requires two passes
 
689
                    # which breaks the fast display of the first revision
 
690
                    # though.
 
691
                    depth_adjustment = merge_depth
 
692
                merge_depth -= depth_adjustment
 
693
            yield rev_id, '.'.join(map(str, revno)), merge_depth
 
694
 
 
695
 
 
696
@deprecated_function(deprecated_in((2, 2, 0)))
 
697
def calculate_view_revisions(branch, start_revision, end_revision, direction,
 
698
        specific_fileid, generate_merge_revisions):
 
699
    """Calculate the revisions to view.
 
700
 
 
701
    :return: An iterator of (revision_id, dotted_revno, merge_depth) tuples OR
 
702
             a list of the same tuples.
 
703
    """
 
704
    start_rev_id, end_rev_id = _get_revision_limits(branch, start_revision,
 
705
        end_revision)
 
706
    view_revisions = list(_calc_view_revisions(branch, start_rev_id, end_rev_id,
 
707
        direction, generate_merge_revisions or specific_fileid))
 
708
    if specific_fileid:
 
709
        view_revisions = _filter_revisions_touching_file_id(branch,
 
710
            specific_fileid, view_revisions,
 
711
            include_merges=generate_merge_revisions)
 
712
    return _rebase_merge_depth(view_revisions)
 
713
 
 
714
 
 
715
def _rebase_merge_depth(view_revisions):
 
716
    """Adjust depths upwards so the top level is 0."""
 
717
    # If either the first or last revision have a merge_depth of 0, we're done
 
718
    if view_revisions and view_revisions[0][2] and view_revisions[-1][2]:
 
719
        min_depth = min([d for r,n,d in view_revisions])
 
720
        if min_depth != 0:
 
721
            view_revisions = [(r,n,d-min_depth) for r,n,d in view_revisions]
 
722
    return view_revisions
 
723
 
 
724
 
 
725
def make_log_rev_iterator(branch, view_revisions, generate_delta, search,
 
726
        file_ids=None, direction='reverse'):
 
727
    """Create a revision iterator for log.
 
728
 
 
729
    :param branch: The branch being logged.
 
730
    :param view_revisions: The revisions being viewed.
 
731
    :param generate_delta: Whether to generate a delta for each revision.
 
732
      Permitted values are None, 'full' and 'partial'.
 
733
    :param search: A user text search string.
 
734
    :param file_ids: If non empty, only revisions matching one or more of
 
735
      the file-ids are to be kept.
 
736
    :param direction: the direction in which view_revisions is sorted
 
737
    :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
738
        delta).
 
739
    """
 
740
    # Convert view_revisions into (view, None, None) groups to fit with
 
741
    # the standard interface here.
 
742
    if type(view_revisions) == list:
 
743
        # A single batch conversion is faster than many incremental ones.
 
744
        # As we have all the data, do a batch conversion.
 
745
        nones = [None] * len(view_revisions)
 
746
        log_rev_iterator = iter([zip(view_revisions, nones, nones)])
 
747
    else:
 
748
        def _convert():
 
749
            for view in view_revisions:
 
750
                yield (view, None, None)
 
751
        log_rev_iterator = iter([_convert()])
 
752
    for adapter in log_adapters:
 
753
        # It would be nicer if log adapters were first class objects
 
754
        # with custom parameters. This will do for now. IGC 20090127
 
755
        if adapter == _make_delta_filter:
 
756
            log_rev_iterator = adapter(branch, generate_delta,
 
757
                search, log_rev_iterator, file_ids, direction)
 
758
        else:
 
759
            log_rev_iterator = adapter(branch, generate_delta,
 
760
                search, log_rev_iterator)
 
761
    return log_rev_iterator
 
762
 
 
763
 
 
764
def _make_search_filter(branch, generate_delta, search, log_rev_iterator):
 
765
    """Create a filtered iterator of log_rev_iterator matching on a regex.
 
766
 
 
767
    :param branch: The branch being logged.
 
768
    :param generate_delta: Whether to generate a delta for each revision.
 
769
    :param search: A user text search string.
 
770
    :param log_rev_iterator: An input iterator containing all revisions that
 
771
        could be displayed, in lists.
 
772
    :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
773
        delta).
 
774
    """
 
775
    if search is None:
 
776
        return log_rev_iterator
 
777
    searchRE = re_compile_checked(search, re.IGNORECASE,
 
778
            'log message filter')
 
779
    return _filter_message_re(searchRE, log_rev_iterator)
 
780
 
 
781
 
 
782
def _filter_message_re(searchRE, log_rev_iterator):
 
783
    for revs in log_rev_iterator:
 
784
        new_revs = []
 
785
        for (rev_id, revno, merge_depth), rev, delta in revs:
 
786
            if searchRE.search(rev.message):
 
787
                new_revs.append(((rev_id, revno, merge_depth), rev, delta))
 
788
        yield new_revs
 
789
 
 
790
 
 
791
def _make_delta_filter(branch, generate_delta, search, log_rev_iterator,
 
792
    fileids=None, direction='reverse'):
 
793
    """Add revision deltas to a log iterator if needed.
 
794
 
 
795
    :param branch: The branch being logged.
 
796
    :param generate_delta: Whether to generate a delta for each revision.
 
797
      Permitted values are None, 'full' and 'partial'.
 
798
    :param search: A user text search string.
 
799
    :param log_rev_iterator: An input iterator containing all revisions that
 
800
        could be displayed, in lists.
 
801
    :param fileids: If non empty, only revisions matching one or more of
 
802
      the file-ids are to be kept.
 
803
    :param direction: the direction in which view_revisions is sorted
 
804
    :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
805
        delta).
 
806
    """
 
807
    if not generate_delta and not fileids:
 
808
        return log_rev_iterator
 
809
    return _generate_deltas(branch.repository, log_rev_iterator,
 
810
        generate_delta, fileids, direction)
 
811
 
 
812
 
 
813
def _generate_deltas(repository, log_rev_iterator, delta_type, fileids,
 
814
    direction):
 
815
    """Create deltas for each batch of revisions in log_rev_iterator.
 
816
 
 
817
    If we're only generating deltas for the sake of filtering against
 
818
    file-ids, we stop generating deltas once all file-ids reach the
 
819
    appropriate life-cycle point. If we're receiving data newest to
 
820
    oldest, then that life-cycle point is 'add', otherwise it's 'remove'.
 
821
    """
 
822
    check_fileids = fileids is not None and len(fileids) > 0
 
823
    if check_fileids:
 
824
        fileid_set = set(fileids)
 
825
        if direction == 'reverse':
 
826
            stop_on = 'add'
 
827
        else:
 
828
            stop_on = 'remove'
 
829
    else:
 
830
        fileid_set = None
 
831
    for revs in log_rev_iterator:
 
832
        # If we were matching against fileids and we've run out,
 
833
        # there's nothing left to do
 
834
        if check_fileids and not fileid_set:
 
835
            return
 
836
        revisions = [rev[1] for rev in revs]
 
837
        new_revs = []
 
838
        if delta_type == 'full' and not check_fileids:
 
839
            deltas = repository.get_deltas_for_revisions(revisions)
 
840
            for rev, delta in izip(revs, deltas):
 
841
                new_revs.append((rev[0], rev[1], delta))
 
842
        else:
 
843
            deltas = repository.get_deltas_for_revisions(revisions, fileid_set)
 
844
            for rev, delta in izip(revs, deltas):
 
845
                if check_fileids:
 
846
                    if delta is None or not delta.has_changed():
 
847
                        continue
 
848
                    else:
 
849
                        _update_fileids(delta, fileid_set, stop_on)
 
850
                        if delta_type is None:
 
851
                            delta = None
 
852
                        elif delta_type == 'full':
 
853
                            # If the file matches all the time, rebuilding
 
854
                            # a full delta like this in addition to a partial
 
855
                            # one could be slow. However, it's likely that
 
856
                            # most revisions won't get this far, making it
 
857
                            # faster to filter on the partial deltas and
 
858
                            # build the occasional full delta than always
 
859
                            # building full deltas and filtering those.
 
860
                            rev_id = rev[0][0]
 
861
                            delta = repository.get_revision_delta(rev_id)
 
862
                new_revs.append((rev[0], rev[1], delta))
 
863
        yield new_revs
 
864
 
 
865
 
 
866
def _update_fileids(delta, fileids, stop_on):
 
867
    """Update the set of file-ids to search based on file lifecycle events.
 
868
    
 
869
    :param fileids: a set of fileids to update
 
870
    :param stop_on: either 'add' or 'remove' - take file-ids out of the
 
871
      fileids set once their add or remove entry is detected respectively
 
872
    """
 
873
    if stop_on == 'add':
 
874
        for item in delta.added:
 
875
            if item[1] in fileids:
 
876
                fileids.remove(item[1])
 
877
    elif stop_on == 'delete':
 
878
        for item in delta.removed:
 
879
            if item[1] in fileids:
 
880
                fileids.remove(item[1])
 
881
 
 
882
 
 
883
def _make_revision_objects(branch, generate_delta, search, log_rev_iterator):
 
884
    """Extract revision objects from the repository
 
885
 
 
886
    :param branch: The branch being logged.
 
887
    :param generate_delta: Whether to generate a delta for each revision.
 
888
    :param search: A user text search string.
 
889
    :param log_rev_iterator: An input iterator containing all revisions that
 
890
        could be displayed, in lists.
 
891
    :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
892
        delta).
 
893
    """
 
894
    repository = branch.repository
 
895
    for revs in log_rev_iterator:
 
896
        # r = revision_id, n = revno, d = merge depth
 
897
        revision_ids = [view[0] for view, _, _ in revs]
 
898
        revisions = repository.get_revisions(revision_ids)
 
899
        revs = [(rev[0], revision, rev[2]) for rev, revision in
 
900
            izip(revs, revisions)]
 
901
        yield revs
 
902
 
 
903
 
 
904
def _make_batch_filter(branch, generate_delta, search, log_rev_iterator):
 
905
    """Group up a single large batch into smaller ones.
 
906
 
 
907
    :param branch: The branch being logged.
 
908
    :param generate_delta: Whether to generate a delta for each revision.
 
909
    :param search: A user text search string.
 
910
    :param log_rev_iterator: An input iterator containing all revisions that
 
911
        could be displayed, in lists.
 
912
    :return: An iterator over lists of ((rev_id, revno, merge_depth), rev,
 
913
        delta).
 
914
    """
 
915
    repository = branch.repository
 
916
    num = 9
 
917
    for batch in log_rev_iterator:
 
918
        batch = iter(batch)
 
919
        while True:
 
920
            step = [detail for _, detail in zip(range(num), batch)]
 
921
            if len(step) == 0:
 
922
                break
 
923
            yield step
 
924
            num = min(int(num * 1.5), 200)
 
925
 
 
926
 
 
927
def _get_revision_limits(branch, start_revision, end_revision):
 
928
    """Get and check revision limits.
 
929
 
 
930
    :param  branch: The branch containing the revisions.
 
931
 
 
932
    :param  start_revision: The first revision to be logged.
 
933
            For backwards compatibility this may be a mainline integer revno,
 
934
            but for merge revision support a RevisionInfo is expected.
 
935
 
 
936
    :param  end_revision: The last revision to be logged.
 
937
            For backwards compatibility this may be a mainline integer revno,
 
938
            but for merge revision support a RevisionInfo is expected.
 
939
 
 
940
    :return: (start_rev_id, end_rev_id) tuple.
 
941
    """
 
942
    branch_revno, branch_rev_id = branch.last_revision_info()
 
943
    start_rev_id = None
 
944
    if start_revision is None:
 
945
        start_revno = 1
 
946
    else:
 
947
        if isinstance(start_revision, revisionspec.RevisionInfo):
 
948
            start_rev_id = start_revision.rev_id
 
949
            start_revno = start_revision.revno or 1
 
950
        else:
 
951
            branch.check_real_revno(start_revision)
 
952
            start_revno = start_revision
 
953
            start_rev_id = branch.get_rev_id(start_revno)
 
954
 
 
955
    end_rev_id = None
 
956
    if end_revision is None:
 
957
        end_revno = branch_revno
 
958
    else:
 
959
        if isinstance(end_revision, revisionspec.RevisionInfo):
 
960
            end_rev_id = end_revision.rev_id
 
961
            end_revno = end_revision.revno or branch_revno
 
962
        else:
 
963
            branch.check_real_revno(end_revision)
 
964
            end_revno = end_revision
 
965
            end_rev_id = branch.get_rev_id(end_revno)
 
966
 
 
967
    if branch_revno != 0:
 
968
        if (start_rev_id == _mod_revision.NULL_REVISION
 
969
            or end_rev_id == _mod_revision.NULL_REVISION):
 
970
            raise errors.BzrCommandError('Logging revision 0 is invalid.')
 
971
        if start_revno > end_revno:
 
972
            raise errors.BzrCommandError("Start revision must be older than "
 
973
                                         "the end revision.")
 
974
    return (start_rev_id, end_rev_id)
 
975
 
 
976
 
 
977
def _get_mainline_revs(branch, start_revision, end_revision):
 
978
    """Get the mainline revisions from the branch.
 
979
 
 
980
    Generates the list of mainline revisions for the branch.
 
981
 
 
982
    :param  branch: The branch containing the revisions.
 
983
 
 
984
    :param  start_revision: The first revision to be logged.
 
985
            For backwards compatibility this may be a mainline integer revno,
 
986
            but for merge revision support a RevisionInfo is expected.
 
987
 
 
988
    :param  end_revision: The last revision to be logged.
 
989
            For backwards compatibility this may be a mainline integer revno,
 
990
            but for merge revision support a RevisionInfo is expected.
 
991
 
 
992
    :return: A (mainline_revs, rev_nos, start_rev_id, end_rev_id) tuple.
 
993
    """
 
994
    branch_revno, branch_last_revision = branch.last_revision_info()
 
995
    if branch_revno == 0:
 
996
        return None, None, None, None
 
997
 
 
998
    # For mainline generation, map start_revision and end_revision to
 
999
    # mainline revnos. If the revision is not on the mainline choose the
 
1000
    # appropriate extreme of the mainline instead - the extra will be
 
1001
    # filtered later.
 
1002
    # Also map the revisions to rev_ids, to be used in the later filtering
 
1003
    # stage.
 
1004
    start_rev_id = None
 
1005
    if start_revision is None:
 
1006
        start_revno = 1
 
1007
    else:
 
1008
        if isinstance(start_revision, revisionspec.RevisionInfo):
 
1009
            start_rev_id = start_revision.rev_id
 
1010
            start_revno = start_revision.revno or 1
 
1011
        else:
 
1012
            branch.check_real_revno(start_revision)
 
1013
            start_revno = start_revision
 
1014
 
 
1015
    end_rev_id = None
 
1016
    if end_revision is None:
 
1017
        end_revno = branch_revno
 
1018
    else:
 
1019
        if isinstance(end_revision, revisionspec.RevisionInfo):
 
1020
            end_rev_id = end_revision.rev_id
 
1021
            end_revno = end_revision.revno or branch_revno
 
1022
        else:
 
1023
            branch.check_real_revno(end_revision)
 
1024
            end_revno = end_revision
 
1025
 
 
1026
    if ((start_rev_id == _mod_revision.NULL_REVISION)
 
1027
        or (end_rev_id == _mod_revision.NULL_REVISION)):
 
1028
        raise errors.BzrCommandError('Logging revision 0 is invalid.')
 
1029
    if start_revno > end_revno:
 
1030
        raise errors.BzrCommandError("Start revision must be older than "
 
1031
                                     "the end revision.")
 
1032
 
 
1033
    if end_revno < start_revno:
 
1034
        return None, None, None, None
 
1035
    cur_revno = branch_revno
 
1036
    rev_nos = {}
 
1037
    mainline_revs = []
 
1038
    for revision_id in branch.repository.iter_reverse_revision_history(
 
1039
                        branch_last_revision):
 
1040
        if cur_revno < start_revno:
 
1041
            # We have gone far enough, but we always add 1 more revision
 
1042
            rev_nos[revision_id] = cur_revno
 
1043
            mainline_revs.append(revision_id)
 
1044
            break
 
1045
        if cur_revno <= end_revno:
 
1046
            rev_nos[revision_id] = cur_revno
 
1047
            mainline_revs.append(revision_id)
 
1048
        cur_revno -= 1
 
1049
    else:
 
1050
        # We walked off the edge of all revisions, so we add a 'None' marker
 
1051
        mainline_revs.append(None)
 
1052
 
 
1053
    mainline_revs.reverse()
 
1054
 
 
1055
    # override the mainline to look like the revision history.
 
1056
    return mainline_revs, rev_nos, start_rev_id, end_rev_id
 
1057
 
 
1058
 
 
1059
@deprecated_function(deprecated_in((2, 2, 0)))
 
1060
def _filter_revision_range(view_revisions, start_rev_id, end_rev_id):
 
1061
    """Filter view_revisions based on revision ranges.
 
1062
 
 
1063
    :param view_revisions: A list of (revision_id, dotted_revno, merge_depth)
 
1064
            tuples to be filtered.
 
1065
 
 
1066
    :param start_rev_id: If not NONE specifies the first revision to be logged.
 
1067
            If NONE then all revisions up to the end_rev_id are logged.
 
1068
 
 
1069
    :param end_rev_id: If not NONE specifies the last revision to be logged.
 
1070
            If NONE then all revisions up to the end of the log are logged.
 
1071
 
 
1072
    :return: The filtered view_revisions.
 
1073
    """
 
1074
    if start_rev_id or end_rev_id:
 
1075
        revision_ids = [r for r, n, d in view_revisions]
 
1076
        if start_rev_id:
 
1077
            start_index = revision_ids.index(start_rev_id)
 
1078
        else:
 
1079
            start_index = 0
 
1080
        if start_rev_id == end_rev_id:
 
1081
            end_index = start_index
 
1082
        else:
 
1083
            if end_rev_id:
 
1084
                end_index = revision_ids.index(end_rev_id)
 
1085
            else:
 
1086
                end_index = len(view_revisions) - 1
 
1087
        # To include the revisions merged into the last revision,
 
1088
        # extend end_rev_id down to, but not including, the next rev
 
1089
        # with the same or lesser merge_depth
 
1090
        end_merge_depth = view_revisions[end_index][2]
 
1091
        try:
 
1092
            for index in xrange(end_index+1, len(view_revisions)+1):
 
1093
                if view_revisions[index][2] <= end_merge_depth:
 
1094
                    end_index = index - 1
 
1095
                    break
 
1096
        except IndexError:
 
1097
            # if the search falls off the end then log to the end as well
 
1098
            end_index = len(view_revisions) - 1
 
1099
        view_revisions = view_revisions[start_index:end_index+1]
 
1100
    return view_revisions
 
1101
 
 
1102
 
 
1103
def _filter_revisions_touching_file_id(branch, file_id, view_revisions,
 
1104
    include_merges=True):
 
1105
    r"""Return the list of revision ids which touch a given file id.
 
1106
 
 
1107
    The function filters view_revisions and returns a subset.
 
1108
    This includes the revisions which directly change the file id,
 
1109
    and the revisions which merge these changes. So if the
 
1110
    revision graph is::
 
1111
        A-.
 
1112
        |\ \
 
1113
        B C E
 
1114
        |/ /
 
1115
        D |
 
1116
        |\|
 
1117
        | F
 
1118
        |/
 
1119
        G
 
1120
 
 
1121
    And 'C' changes a file, then both C and D will be returned. F will not be
 
1122
    returned even though it brings the changes to C into the branch starting
 
1123
    with E. (Note that if we were using F as the tip instead of G, then we
 
1124
    would see C, D, F.)
 
1125
 
 
1126
    This will also be restricted based on a subset of the mainline.
 
1127
 
 
1128
    :param branch: The branch where we can get text revision information.
 
1129
 
 
1130
    :param file_id: Filter out revisions that do not touch file_id.
 
1131
 
 
1132
    :param view_revisions: A list of (revision_id, dotted_revno, merge_depth)
 
1133
        tuples. This is the list of revisions which will be filtered. It is
 
1134
        assumed that view_revisions is in merge_sort order (i.e. newest
 
1135
        revision first ).
 
1136
 
 
1137
    :param include_merges: include merge revisions in the result or not
 
1138
 
 
1139
    :return: A list of (revision_id, dotted_revno, merge_depth) tuples.
 
1140
    """
 
1141
    # Lookup all possible text keys to determine which ones actually modified
 
1142
    # the file.
 
1143
    text_keys = [(file_id, rev_id) for rev_id, revno, depth in view_revisions]
 
1144
    next_keys = None
 
1145
    # Looking up keys in batches of 1000 can cut the time in half, as well as
 
1146
    # memory consumption. GraphIndex *does* like to look for a few keys in
 
1147
    # parallel, it just doesn't like looking for *lots* of keys in parallel.
 
1148
    # TODO: This code needs to be re-evaluated periodically as we tune the
 
1149
    #       indexing layer. We might consider passing in hints as to the known
 
1150
    #       access pattern (sparse/clustered, high success rate/low success
 
1151
    #       rate). This particular access is clustered with a low success rate.
 
1152
    get_parent_map = branch.repository.texts.get_parent_map
 
1153
    modified_text_revisions = set()
 
1154
    chunk_size = 1000
 
1155
    for start in xrange(0, len(text_keys), chunk_size):
 
1156
        next_keys = text_keys[start:start + chunk_size]
 
1157
        # Only keep the revision_id portion of the key
 
1158
        modified_text_revisions.update(
 
1159
            [k[1] for k in get_parent_map(next_keys)])
 
1160
    del text_keys, next_keys
 
1161
 
 
1162
    result = []
 
1163
    # Track what revisions will merge the current revision, replace entries
 
1164
    # with 'None' when they have been added to result
 
1165
    current_merge_stack = [None]
 
1166
    for info in view_revisions:
 
1167
        rev_id, revno, depth = info
 
1168
        if depth == len(current_merge_stack):
 
1169
            current_merge_stack.append(info)
 
1170
        else:
 
1171
            del current_merge_stack[depth + 1:]
 
1172
            current_merge_stack[-1] = info
 
1173
 
 
1174
        if rev_id in modified_text_revisions:
 
1175
            # This needs to be logged, along with the extra revisions
 
1176
            for idx in xrange(len(current_merge_stack)):
 
1177
                node = current_merge_stack[idx]
 
1178
                if node is not None:
 
1179
                    if include_merges or node[2] == 0:
 
1180
                        result.append(node)
 
1181
                        current_merge_stack[idx] = None
 
1182
    return result
 
1183
 
 
1184
 
 
1185
@deprecated_function(deprecated_in((2, 2, 0)))
 
1186
def get_view_revisions(mainline_revs, rev_nos, branch, direction,
 
1187
                       include_merges=True):
 
1188
    """Produce an iterator of revisions to show
 
1189
    :return: an iterator of (revision_id, revno, merge_depth)
 
1190
    (if there is no revno for a revision, None is supplied)
 
1191
    """
 
1192
    if not include_merges:
 
1193
        revision_ids = mainline_revs[1:]
 
1194
        if direction == 'reverse':
 
1195
            revision_ids.reverse()
 
1196
        for revision_id in revision_ids:
 
1197
            yield revision_id, str(rev_nos[revision_id]), 0
 
1198
        return
 
1199
    graph = branch.repository.get_graph()
 
1200
    # This asks for all mainline revisions, which means we only have to spider
 
1201
    # sideways, rather than depth history. That said, its still size-of-history
 
1202
    # and should be addressed.
 
1203
    # mainline_revisions always includes an extra revision at the beginning, so
 
1204
    # don't request it.
 
1205
    parent_map = dict(((key, value) for key, value in
 
1206
        graph.iter_ancestry(mainline_revs[1:]) if value is not None))
 
1207
    # filter out ghosts; merge_sort errors on ghosts.
 
1208
    rev_graph = _mod_repository._strip_NULL_ghosts(parent_map)
 
1209
    merge_sorted_revisions = tsort.merge_sort(
 
1210
        rev_graph,
 
1211
        mainline_revs[-1],
 
1212
        mainline_revs,
 
1213
        generate_revno=True)
 
1214
 
 
1215
    if direction == 'forward':
 
1216
        # forward means oldest first.
 
1217
        merge_sorted_revisions = reverse_by_depth(merge_sorted_revisions)
 
1218
    elif direction != 'reverse':
 
1219
        raise ValueError('invalid direction %r' % direction)
 
1220
 
 
1221
    for (sequence, rev_id, merge_depth, revno, end_of_merge
 
1222
         ) in merge_sorted_revisions:
 
1223
        yield rev_id, '.'.join(map(str, revno)), merge_depth
 
1224
 
 
1225
 
 
1226
def reverse_by_depth(merge_sorted_revisions, _depth=0):
 
1227
    """Reverse revisions by depth.
 
1228
 
 
1229
    Revisions with a different depth are sorted as a group with the previous
 
1230
    revision of that depth.  There may be no topological justification for this,
 
1231
    but it looks much nicer.
 
1232
    """
 
1233
    # Add a fake revision at start so that we can always attach sub revisions
 
1234
    merge_sorted_revisions = [(None, None, _depth)] + merge_sorted_revisions
 
1235
    zd_revisions = []
 
1236
    for val in merge_sorted_revisions:
 
1237
        if val[2] == _depth:
 
1238
            # Each revision at the current depth becomes a chunk grouping all
 
1239
            # higher depth revisions.
 
1240
            zd_revisions.append([val])
 
1241
        else:
 
1242
            zd_revisions[-1].append(val)
 
1243
    for revisions in zd_revisions:
 
1244
        if len(revisions) > 1:
 
1245
            # We have higher depth revisions, let reverse them locally
 
1246
            revisions[1:] = reverse_by_depth(revisions[1:], _depth + 1)
 
1247
    zd_revisions.reverse()
 
1248
    result = []
 
1249
    for chunk in zd_revisions:
 
1250
        result.extend(chunk)
 
1251
    if _depth == 0:
 
1252
        # Top level call, get rid of the fake revisions that have been added
 
1253
        result = [r for r in result if r[0] is not None and r[1] is not None]
 
1254
    return result
 
1255
 
 
1256
 
 
1257
class LogRevision(object):
 
1258
    """A revision to be logged (by LogFormatter.log_revision).
 
1259
 
 
1260
    A simple wrapper for the attributes of a revision to be logged.
 
1261
    The attributes may or may not be populated, as determined by the
 
1262
    logging options and the log formatter capabilities.
 
1263
    """
 
1264
 
 
1265
    def __init__(self, rev=None, revno=None, merge_depth=0, delta=None,
 
1266
                 tags=None, diff=None):
 
1267
        self.rev = rev
 
1268
        self.revno = str(revno)
 
1269
        self.merge_depth = merge_depth
 
1270
        self.delta = delta
 
1271
        self.tags = tags
 
1272
        self.diff = diff
 
1273
 
 
1274
 
 
1275
class LogFormatter(object):
 
1276
    """Abstract class to display log messages.
 
1277
 
 
1278
    At a minimum, a derived class must implement the log_revision method.
 
1279
 
 
1280
    If the LogFormatter needs to be informed of the beginning or end of
 
1281
    a log it should implement the begin_log and/or end_log hook methods.
 
1282
 
 
1283
    A LogFormatter should define the following supports_XXX flags
 
1284
    to indicate which LogRevision attributes it supports:
 
1285
 
 
1286
    - supports_delta must be True if this log formatter supports delta.
 
1287
        Otherwise the delta attribute may not be populated.  The 'delta_format'
 
1288
        attribute describes whether the 'short_status' format (1) or the long
 
1289
        one (2) should be used.
 
1290
 
 
1291
    - supports_merge_revisions must be True if this log formatter supports
 
1292
        merge revisions.  If not, then only mainline revisions will be passed
 
1293
        to the formatter.
 
1294
 
 
1295
    - preferred_levels is the number of levels this formatter defaults to.
 
1296
        The default value is zero meaning display all levels.
 
1297
        This value is only relevant if supports_merge_revisions is True.
 
1298
 
 
1299
    - supports_tags must be True if this log formatter supports tags.
 
1300
        Otherwise the tags attribute may not be populated.
 
1301
 
 
1302
    - supports_diff must be True if this log formatter supports diffs.
 
1303
        Otherwise the diff attribute may not be populated.
 
1304
 
 
1305
    Plugins can register functions to show custom revision properties using
 
1306
    the properties_handler_registry. The registered function
 
1307
    must respect the following interface description:
 
1308
        def my_show_properties(properties_dict):
 
1309
            # code that returns a dict {'name':'value'} of the properties
 
1310
            # to be shown
 
1311
    """
 
1312
    preferred_levels = 0
 
1313
 
 
1314
    def __init__(self, to_file, show_ids=False, show_timezone='original',
 
1315
                 delta_format=None, levels=None, show_advice=False,
 
1316
                 to_exact_file=None):
 
1317
        """Create a LogFormatter.
 
1318
 
 
1319
        :param to_file: the file to output to
 
1320
        :param to_exact_file: if set, gives an output stream to which 
 
1321
             non-Unicode diffs are written.
 
1322
        :param show_ids: if True, revision-ids are to be displayed
 
1323
        :param show_timezone: the timezone to use
 
1324
        :param delta_format: the level of delta information to display
 
1325
          or None to leave it to the formatter to decide
 
1326
        :param levels: the number of levels to display; None or -1 to
 
1327
          let the log formatter decide.
 
1328
        :param show_advice: whether to show advice at the end of the
 
1329
          log or not
 
1330
        """
 
1331
        self.to_file = to_file
 
1332
        # 'exact' stream used to show diff, it should print content 'as is'
 
1333
        # and should not try to decode/encode it to unicode to avoid bug #328007
 
1334
        if to_exact_file is not None:
 
1335
            self.to_exact_file = to_exact_file
 
1336
        else:
 
1337
            # XXX: somewhat hacky; this assumes it's a codec writer; it's better
 
1338
            # for code that expects to get diffs to pass in the exact file
 
1339
            # stream
 
1340
            self.to_exact_file = getattr(to_file, 'stream', to_file)
 
1341
        self.show_ids = show_ids
 
1342
        self.show_timezone = show_timezone
 
1343
        if delta_format is None:
 
1344
            # Ensures backward compatibility
 
1345
            delta_format = 2 # long format
 
1346
        self.delta_format = delta_format
 
1347
        self.levels = levels
 
1348
        self._show_advice = show_advice
 
1349
        self._merge_count = 0
 
1350
 
 
1351
    def get_levels(self):
 
1352
        """Get the number of levels to display or 0 for all."""
 
1353
        if getattr(self, 'supports_merge_revisions', False):
 
1354
            if self.levels is None or self.levels == -1:
 
1355
                self.levels = self.preferred_levels
 
1356
        else:
 
1357
            self.levels = 1
 
1358
        return self.levels
 
1359
 
 
1360
    def log_revision(self, revision):
 
1361
        """Log a revision.
 
1362
 
 
1363
        :param  revision:   The LogRevision to be logged.
 
1364
        """
 
1365
        raise NotImplementedError('not implemented in abstract base')
 
1366
 
 
1367
    def show_advice(self):
 
1368
        """Output user advice, if any, when the log is completed."""
 
1369
        if self._show_advice and self.levels == 1 and self._merge_count > 0:
 
1370
            advice_sep = self.get_advice_separator()
 
1371
            if advice_sep:
 
1372
                self.to_file.write(advice_sep)
 
1373
            self.to_file.write(
 
1374
                "Use --include-merges or -n0 to see merged revisions.\n")
 
1375
 
 
1376
    def get_advice_separator(self):
 
1377
        """Get the text separating the log from the closing advice."""
 
1378
        return ''
 
1379
 
 
1380
    def short_committer(self, rev):
 
1381
        name, address = config.parse_username(rev.committer)
 
1382
        if name:
 
1383
            return name
 
1384
        return address
 
1385
 
 
1386
    def short_author(self, rev):
 
1387
        name, address = config.parse_username(rev.get_apparent_authors()[0])
 
1388
        if name:
 
1389
            return name
 
1390
        return address
 
1391
 
 
1392
    def merge_marker(self, revision):
 
1393
        """Get the merge marker to include in the output or '' if none."""
 
1394
        if len(revision.rev.parent_ids) > 1:
 
1395
            self._merge_count += 1
 
1396
            return ' [merge]'
 
1397
        else:
 
1398
            return ''
 
1399
 
 
1400
    def show_properties(self, revision, indent):
 
1401
        """Displays the custom properties returned by each registered handler.
 
1402
 
 
1403
        If a registered handler raises an error it is propagated.
 
1404
        """
 
1405
        for line in self.custom_properties(revision):
 
1406
            self.to_file.write("%s%s\n" % (indent, line))
 
1407
 
 
1408
    def custom_properties(self, revision):
 
1409
        """Format the custom properties returned by each registered handler.
 
1410
 
 
1411
        If a registered handler raises an error it is propagated.
 
1412
 
 
1413
        :return: a list of formatted lines (excluding trailing newlines)
 
1414
        """
 
1415
        lines = self._foreign_info_properties(revision)
 
1416
        for key, handler in properties_handler_registry.iteritems():
 
1417
            lines.extend(self._format_properties(handler(revision)))
 
1418
        return lines
 
1419
 
 
1420
    def _foreign_info_properties(self, rev):
 
1421
        """Custom log displayer for foreign revision identifiers.
 
1422
 
 
1423
        :param rev: Revision object.
 
1424
        """
 
1425
        # Revision comes directly from a foreign repository
 
1426
        if isinstance(rev, foreign.ForeignRevision):
 
1427
            return self._format_properties(rev.mapping.vcs.show_foreign_revid(rev.foreign_revid))
 
1428
 
 
1429
        # Imported foreign revision revision ids always contain :
 
1430
        if not ":" in rev.revision_id:
 
1431
            return []
 
1432
 
 
1433
        # Revision was once imported from a foreign repository
 
1434
        try:
 
1435
            foreign_revid, mapping = \
 
1436
                foreign.foreign_vcs_registry.parse_revision_id(rev.revision_id)
 
1437
        except errors.InvalidRevisionId:
 
1438
            return []
 
1439
 
 
1440
        return self._format_properties(
 
1441
            mapping.vcs.show_foreign_revid(foreign_revid))
 
1442
 
 
1443
    def _format_properties(self, properties):
 
1444
        lines = []
 
1445
        for key, value in properties.items():
 
1446
            lines.append(key + ': ' + value)
 
1447
        return lines
 
1448
 
 
1449
    def show_diff(self, to_file, diff, indent):
 
1450
        for l in diff.rstrip().split('\n'):
 
1451
            to_file.write(indent + '%s\n' % (l,))
 
1452
 
 
1453
 
 
1454
# Separator between revisions in long format
 
1455
_LONG_SEP = '-' * 60
 
1456
 
 
1457
 
 
1458
class LongLogFormatter(LogFormatter):
 
1459
 
 
1460
    supports_merge_revisions = True
 
1461
    preferred_levels = 1
 
1462
    supports_delta = True
 
1463
    supports_tags = True
 
1464
    supports_diff = True
 
1465
 
 
1466
    def __init__(self, *args, **kwargs):
 
1467
        super(LongLogFormatter, self).__init__(*args, **kwargs)
 
1468
        if self.show_timezone == 'original':
 
1469
            self.date_string = self._date_string_original_timezone
 
1470
        else:
 
1471
            self.date_string = self._date_string_with_timezone
 
1472
 
 
1473
    def _date_string_with_timezone(self, rev):
 
1474
        return format_date(rev.timestamp, rev.timezone or 0,
 
1475
                           self.show_timezone)
 
1476
 
 
1477
    def _date_string_original_timezone(self, rev):
 
1478
        return format_date_with_offset_in_original_timezone(rev.timestamp,
 
1479
            rev.timezone or 0)
 
1480
 
 
1481
    def log_revision(self, revision):
 
1482
        """Log a revision, either merged or not."""
 
1483
        indent = '    ' * revision.merge_depth
 
1484
        lines = [_LONG_SEP]
 
1485
        if revision.revno is not None:
 
1486
            lines.append('revno: %s%s' % (revision.revno,
 
1487
                self.merge_marker(revision)))
 
1488
        if revision.tags:
 
1489
            lines.append('tags: %s' % (', '.join(revision.tags)))
 
1490
        if self.show_ids:
 
1491
            lines.append('revision-id: %s' % (revision.rev.revision_id,))
 
1492
            for parent_id in revision.rev.parent_ids:
 
1493
                lines.append('parent: %s' % (parent_id,))
 
1494
        lines.extend(self.custom_properties(revision.rev))
 
1495
 
 
1496
        committer = revision.rev.committer
 
1497
        authors = revision.rev.get_apparent_authors()
 
1498
        if authors != [committer]:
 
1499
            lines.append('author: %s' % (", ".join(authors),))
 
1500
        lines.append('committer: %s' % (committer,))
 
1501
 
 
1502
        branch_nick = revision.rev.properties.get('branch-nick', None)
 
1503
        if branch_nick is not None:
 
1504
            lines.append('branch nick: %s' % (branch_nick,))
 
1505
 
 
1506
        lines.append('timestamp: %s' % (self.date_string(revision.rev),))
 
1507
 
 
1508
        lines.append('message:')
 
1509
        if not revision.rev.message:
 
1510
            lines.append('  (no message)')
 
1511
        else:
 
1512
            message = revision.rev.message.rstrip('\r\n')
 
1513
            for l in message.split('\n'):
 
1514
                lines.append('  %s' % (l,))
 
1515
 
 
1516
        # Dump the output, appending the delta and diff if requested
 
1517
        to_file = self.to_file
 
1518
        to_file.write("%s%s\n" % (indent, ('\n' + indent).join(lines)))
 
1519
        if revision.delta is not None:
 
1520
            # We don't respect delta_format for compatibility
 
1521
            revision.delta.show(to_file, self.show_ids, indent=indent,
 
1522
                                short_status=False)
 
1523
        if revision.diff is not None:
 
1524
            to_file.write(indent + 'diff:\n')
 
1525
            to_file.flush()
 
1526
            # Note: we explicitly don't indent the diff (relative to the
 
1527
            # revision information) so that the output can be fed to patch -p0
 
1528
            self.show_diff(self.to_exact_file, revision.diff, indent)
 
1529
            self.to_exact_file.flush()
 
1530
 
 
1531
    def get_advice_separator(self):
 
1532
        """Get the text separating the log from the closing advice."""
 
1533
        return '-' * 60 + '\n'
 
1534
 
 
1535
 
 
1536
class ShortLogFormatter(LogFormatter):
 
1537
 
 
1538
    supports_merge_revisions = True
 
1539
    preferred_levels = 1
 
1540
    supports_delta = True
 
1541
    supports_tags = True
 
1542
    supports_diff = True
 
1543
 
 
1544
    def __init__(self, *args, **kwargs):
 
1545
        super(ShortLogFormatter, self).__init__(*args, **kwargs)
 
1546
        self.revno_width_by_depth = {}
 
1547
 
 
1548
    def log_revision(self, revision):
 
1549
        # We need two indents: one per depth and one for the information
 
1550
        # relative to that indent. Most mainline revnos are 5 chars or
 
1551
        # less while dotted revnos are typically 11 chars or less. Once
 
1552
        # calculated, we need to remember the offset for a given depth
 
1553
        # as we might be starting from a dotted revno in the first column
 
1554
        # and we want subsequent mainline revisions to line up.
 
1555
        depth = revision.merge_depth
 
1556
        indent = '    ' * depth
 
1557
        revno_width = self.revno_width_by_depth.get(depth)
 
1558
        if revno_width is None:
 
1559
            if revision.revno.find('.') == -1:
 
1560
                # mainline revno, e.g. 12345
 
1561
                revno_width = 5
 
1562
            else:
 
1563
                # dotted revno, e.g. 12345.10.55
 
1564
                revno_width = 11
 
1565
            self.revno_width_by_depth[depth] = revno_width
 
1566
        offset = ' ' * (revno_width + 1)
 
1567
 
 
1568
        to_file = self.to_file
 
1569
        tags = ''
 
1570
        if revision.tags:
 
1571
            tags = ' {%s}' % (', '.join(revision.tags))
 
1572
        to_file.write(indent + "%*s %s\t%s%s%s\n" % (revno_width,
 
1573
                revision.revno, self.short_author(revision.rev),
 
1574
                format_date(revision.rev.timestamp,
 
1575
                            revision.rev.timezone or 0,
 
1576
                            self.show_timezone, date_fmt="%Y-%m-%d",
 
1577
                            show_offset=False),
 
1578
                tags, self.merge_marker(revision)))
 
1579
        self.show_properties(revision.rev, indent+offset)
 
1580
        if self.show_ids:
 
1581
            to_file.write(indent + offset + 'revision-id:%s\n'
 
1582
                          % (revision.rev.revision_id,))
 
1583
        if not revision.rev.message:
 
1584
            to_file.write(indent + offset + '(no message)\n')
 
1585
        else:
 
1586
            message = revision.rev.message.rstrip('\r\n')
 
1587
            for l in message.split('\n'):
 
1588
                to_file.write(indent + offset + '%s\n' % (l,))
 
1589
 
 
1590
        if revision.delta is not None:
 
1591
            revision.delta.show(to_file, self.show_ids, indent=indent + offset,
 
1592
                                short_status=self.delta_format==1)
 
1593
        if revision.diff is not None:
 
1594
            self.show_diff(self.to_exact_file, revision.diff, '      ')
 
1595
        to_file.write('\n')
 
1596
 
 
1597
 
 
1598
class LineLogFormatter(LogFormatter):
 
1599
 
 
1600
    supports_merge_revisions = True
 
1601
    preferred_levels = 1
 
1602
    supports_tags = True
 
1603
 
 
1604
    def __init__(self, *args, **kwargs):
 
1605
        super(LineLogFormatter, self).__init__(*args, **kwargs)
 
1606
        width = terminal_width()
 
1607
        if width is not None:
 
1608
            # we need one extra space for terminals that wrap on last char
 
1609
            width = width - 1
 
1610
        self._max_chars = width
 
1611
 
 
1612
    def truncate(self, str, max_len):
 
1613
        if max_len is None or len(str) <= max_len:
 
1614
            return str
 
1615
        return str[:max_len-3] + '...'
 
1616
 
 
1617
    def date_string(self, rev):
 
1618
        return format_date(rev.timestamp, rev.timezone or 0,
 
1619
                           self.show_timezone, date_fmt="%Y-%m-%d",
 
1620
                           show_offset=False)
 
1621
 
 
1622
    def message(self, rev):
 
1623
        if not rev.message:
 
1624
            return '(no message)'
 
1625
        else:
 
1626
            return rev.message
 
1627
 
 
1628
    def log_revision(self, revision):
 
1629
        indent = '  ' * revision.merge_depth
 
1630
        self.to_file.write(self.log_string(revision.revno, revision.rev,
 
1631
            self._max_chars, revision.tags, indent))
 
1632
        self.to_file.write('\n')
 
1633
 
 
1634
    def log_string(self, revno, rev, max_chars, tags=None, prefix=''):
 
1635
        """Format log info into one string. Truncate tail of string
 
1636
        :param  revno:      revision number or None.
 
1637
                            Revision numbers counts from 1.
 
1638
        :param  rev:        revision object
 
1639
        :param  max_chars:  maximum length of resulting string
 
1640
        :param  tags:       list of tags or None
 
1641
        :param  prefix:     string to prefix each line
 
1642
        :return:            formatted truncated string
 
1643
        """
 
1644
        out = []
 
1645
        if revno:
 
1646
            # show revno only when is not None
 
1647
            out.append("%s:" % revno)
 
1648
        out.append(self.truncate(self.short_author(rev), 20))
 
1649
        out.append(self.date_string(rev))
 
1650
        if len(rev.parent_ids) > 1:
 
1651
            out.append('[merge]')
 
1652
        if tags:
 
1653
            tag_str = '{%s}' % (', '.join(tags))
 
1654
            out.append(tag_str)
 
1655
        out.append(rev.get_summary())
 
1656
        return self.truncate(prefix + " ".join(out).rstrip('\n'), max_chars)
 
1657
 
 
1658
 
 
1659
class GnuChangelogLogFormatter(LogFormatter):
 
1660
 
 
1661
    supports_merge_revisions = True
 
1662
    supports_delta = True
 
1663
 
 
1664
    def log_revision(self, revision):
 
1665
        """Log a revision, either merged or not."""
 
1666
        to_file = self.to_file
 
1667
 
 
1668
        date_str = format_date(revision.rev.timestamp,
 
1669
                               revision.rev.timezone or 0,
 
1670
                               self.show_timezone,
 
1671
                               date_fmt='%Y-%m-%d',
 
1672
                               show_offset=False)
 
1673
        committer_str = revision.rev.committer.replace (' <', '  <')
 
1674
        to_file.write('%s  %s\n\n' % (date_str,committer_str))
 
1675
 
 
1676
        if revision.delta is not None and revision.delta.has_changed():
 
1677
            for c in revision.delta.added + revision.delta.removed + revision.delta.modified:
 
1678
                path, = c[:1]
 
1679
                to_file.write('\t* %s:\n' % (path,))
 
1680
            for c in revision.delta.renamed:
 
1681
                oldpath,newpath = c[:2]
 
1682
                # For renamed files, show both the old and the new path
 
1683
                to_file.write('\t* %s:\n\t* %s:\n' % (oldpath,newpath))
 
1684
            to_file.write('\n')
 
1685
 
 
1686
        if not revision.rev.message:
 
1687
            to_file.write('\tNo commit message\n')
 
1688
        else:
 
1689
            message = revision.rev.message.rstrip('\r\n')
 
1690
            for l in message.split('\n'):
 
1691
                to_file.write('\t%s\n' % (l.lstrip(),))
 
1692
            to_file.write('\n')
 
1693
 
 
1694
 
 
1695
def line_log(rev, max_chars):
 
1696
    lf = LineLogFormatter(None)
 
1697
    return lf.log_string(None, rev, max_chars)
 
1698
 
 
1699
 
 
1700
class LogFormatterRegistry(registry.Registry):
 
1701
    """Registry for log formatters"""
 
1702
 
 
1703
    def make_formatter(self, name, *args, **kwargs):
 
1704
        """Construct a formatter from arguments.
 
1705
 
 
1706
        :param name: Name of the formatter to construct.  'short', 'long' and
 
1707
            'line' are built-in.
 
1708
        """
 
1709
        return self.get(name)(*args, **kwargs)
 
1710
 
 
1711
    def get_default(self, branch):
 
1712
        return self.get(branch.get_config().log_format())
 
1713
 
 
1714
 
 
1715
log_formatter_registry = LogFormatterRegistry()
 
1716
 
 
1717
 
 
1718
log_formatter_registry.register('short', ShortLogFormatter,
 
1719
                                'Moderately short log format')
 
1720
log_formatter_registry.register('long', LongLogFormatter,
 
1721
                                'Detailed log format')
 
1722
log_formatter_registry.register('line', LineLogFormatter,
 
1723
                                'Log format with one line per revision')
 
1724
log_formatter_registry.register('gnu-changelog', GnuChangelogLogFormatter,
 
1725
                                'Format used by GNU ChangeLog files')
 
1726
 
 
1727
 
 
1728
def register_formatter(name, formatter):
 
1729
    log_formatter_registry.register(name, formatter)
 
1730
 
 
1731
 
 
1732
def log_formatter(name, *args, **kwargs):
 
1733
    """Construct a formatter from arguments.
 
1734
 
 
1735
    name -- Name of the formatter to construct; currently 'long', 'short' and
 
1736
        'line' are supported.
 
1737
    """
 
1738
    try:
 
1739
        return log_formatter_registry.make_formatter(name, *args, **kwargs)
 
1740
    except KeyError:
 
1741
        raise errors.BzrCommandError("unknown log formatter: %r" % name)
 
1742
 
 
1743
 
 
1744
def show_one_log(revno, rev, delta, verbose, to_file, show_timezone):
 
1745
    # deprecated; for compatibility
 
1746
    lf = LongLogFormatter(to_file=to_file, show_timezone=show_timezone)
 
1747
    lf.show(revno, rev, delta)
 
1748
 
 
1749
 
 
1750
def show_changed_revisions(branch, old_rh, new_rh, to_file=None,
 
1751
                           log_format='long'):
 
1752
    """Show the change in revision history comparing the old revision history to the new one.
 
1753
 
 
1754
    :param branch: The branch where the revisions exist
 
1755
    :param old_rh: The old revision history
 
1756
    :param new_rh: The new revision history
 
1757
    :param to_file: A file to write the results to. If None, stdout will be used
 
1758
    """
 
1759
    if to_file is None:
 
1760
        to_file = codecs.getwriter(get_terminal_encoding())(sys.stdout,
 
1761
            errors='replace')
 
1762
    lf = log_formatter(log_format,
 
1763
                       show_ids=False,
 
1764
                       to_file=to_file,
 
1765
                       show_timezone='original')
 
1766
 
 
1767
    # This is the first index which is different between
 
1768
    # old and new
 
1769
    base_idx = None
 
1770
    for i in xrange(max(len(new_rh),
 
1771
                        len(old_rh))):
 
1772
        if (len(new_rh) <= i
 
1773
            or len(old_rh) <= i
 
1774
            or new_rh[i] != old_rh[i]):
 
1775
            base_idx = i
 
1776
            break
 
1777
 
 
1778
    if base_idx is None:
 
1779
        to_file.write('Nothing seems to have changed\n')
 
1780
        return
 
1781
    ## TODO: It might be nice to do something like show_log
 
1782
    ##       and show the merged entries. But since this is the
 
1783
    ##       removed revisions, it shouldn't be as important
 
1784
    if base_idx < len(old_rh):
 
1785
        to_file.write('*'*60)
 
1786
        to_file.write('\nRemoved Revisions:\n')
 
1787
        for i in range(base_idx, len(old_rh)):
 
1788
            rev = branch.repository.get_revision(old_rh[i])
 
1789
            lr = LogRevision(rev, i+1, 0, None)
 
1790
            lf.log_revision(lr)
 
1791
        to_file.write('*'*60)
 
1792
        to_file.write('\n\n')
 
1793
    if base_idx < len(new_rh):
 
1794
        to_file.write('Added Revisions:\n')
 
1795
        show_log(branch,
 
1796
                 lf,
 
1797
                 None,
 
1798
                 verbose=False,
 
1799
                 direction='forward',
 
1800
                 start_revision=base_idx+1,
 
1801
                 end_revision=len(new_rh),
 
1802
                 search=None)
 
1803
 
 
1804
 
 
1805
def get_history_change(old_revision_id, new_revision_id, repository):
 
1806
    """Calculate the uncommon lefthand history between two revisions.
 
1807
 
 
1808
    :param old_revision_id: The original revision id.
 
1809
    :param new_revision_id: The new revision id.
 
1810
    :param repository: The repository to use for the calculation.
 
1811
 
 
1812
    return old_history, new_history
 
1813
    """
 
1814
    old_history = []
 
1815
    old_revisions = set()
 
1816
    new_history = []
 
1817
    new_revisions = set()
 
1818
    new_iter = repository.iter_reverse_revision_history(new_revision_id)
 
1819
    old_iter = repository.iter_reverse_revision_history(old_revision_id)
 
1820
    stop_revision = None
 
1821
    do_old = True
 
1822
    do_new = True
 
1823
    while do_new or do_old:
 
1824
        if do_new:
 
1825
            try:
 
1826
                new_revision = new_iter.next()
 
1827
            except StopIteration:
 
1828
                do_new = False
 
1829
            else:
 
1830
                new_history.append(new_revision)
 
1831
                new_revisions.add(new_revision)
 
1832
                if new_revision in old_revisions:
 
1833
                    stop_revision = new_revision
 
1834
                    break
 
1835
        if do_old:
 
1836
            try:
 
1837
                old_revision = old_iter.next()
 
1838
            except StopIteration:
 
1839
                do_old = False
 
1840
            else:
 
1841
                old_history.append(old_revision)
 
1842
                old_revisions.add(old_revision)
 
1843
                if old_revision in new_revisions:
 
1844
                    stop_revision = old_revision
 
1845
                    break
 
1846
    new_history.reverse()
 
1847
    old_history.reverse()
 
1848
    if stop_revision is not None:
 
1849
        new_history = new_history[new_history.index(stop_revision) + 1:]
 
1850
        old_history = old_history[old_history.index(stop_revision) + 1:]
 
1851
    return old_history, new_history
 
1852
 
 
1853
 
 
1854
def show_branch_change(branch, output, old_revno, old_revision_id):
 
1855
    """Show the changes made to a branch.
 
1856
 
 
1857
    :param branch: The branch to show changes about.
 
1858
    :param output: A file-like object to write changes to.
 
1859
    :param old_revno: The revno of the old tip.
 
1860
    :param old_revision_id: The revision_id of the old tip.
 
1861
    """
 
1862
    new_revno, new_revision_id = branch.last_revision_info()
 
1863
    old_history, new_history = get_history_change(old_revision_id,
 
1864
                                                  new_revision_id,
 
1865
                                                  branch.repository)
 
1866
    if old_history == [] and new_history == []:
 
1867
        output.write('Nothing seems to have changed\n')
 
1868
        return
 
1869
 
 
1870
    log_format = log_formatter_registry.get_default(branch)
 
1871
    lf = log_format(show_ids=False, to_file=output, show_timezone='original')
 
1872
    if old_history != []:
 
1873
        output.write('*'*60)
 
1874
        output.write('\nRemoved Revisions:\n')
 
1875
        show_flat_log(branch.repository, old_history, old_revno, lf)
 
1876
        output.write('*'*60)
 
1877
        output.write('\n\n')
 
1878
    if new_history != []:
 
1879
        output.write('Added Revisions:\n')
 
1880
        start_revno = new_revno - len(new_history) + 1
 
1881
        show_log(branch, lf, None, verbose=False, direction='forward',
 
1882
                 start_revision=start_revno,)
 
1883
 
 
1884
 
 
1885
def show_flat_log(repository, history, last_revno, lf):
 
1886
    """Show a simple log of the specified history.
 
1887
 
 
1888
    :param repository: The repository to retrieve revisions from.
 
1889
    :param history: A list of revision_ids indicating the lefthand history.
 
1890
    :param last_revno: The revno of the last revision_id in the history.
 
1891
    :param lf: The log formatter to use.
 
1892
    """
 
1893
    start_revno = last_revno - len(history) + 1
 
1894
    revisions = repository.get_revisions(history)
 
1895
    for i, rev in enumerate(revisions):
 
1896
        lr = LogRevision(rev, i + last_revno, 0, None)
 
1897
        lf.log_revision(lr)
 
1898
 
 
1899
 
 
1900
def _get_info_for_log_files(revisionspec_list, file_list):
 
1901
    """Find file-ids and kinds given a list of files and a revision range.
 
1902
 
 
1903
    We search for files at the end of the range. If not found there,
 
1904
    we try the start of the range.
 
1905
 
 
1906
    :param revisionspec_list: revision range as parsed on the command line
 
1907
    :param file_list: the list of paths given on the command line;
 
1908
      the first of these can be a branch location or a file path,
 
1909
      the remainder must be file paths
 
1910
    :return: (branch, info_list, start_rev_info, end_rev_info) where
 
1911
      info_list is a list of (relative_path, file_id, kind) tuples where
 
1912
      kind is one of values 'directory', 'file', 'symlink', 'tree-reference'.
 
1913
      branch will be read-locked.
 
1914
    """
 
1915
    from builtins import _get_revision_range, safe_relpath_files
 
1916
    tree, b, path = bzrdir.BzrDir.open_containing_tree_or_branch(file_list[0])
 
1917
    b.lock_read()
 
1918
    # XXX: It's damn messy converting a list of paths to relative paths when
 
1919
    # those paths might be deleted ones, they might be on a case-insensitive
 
1920
    # filesystem and/or they might be in silly locations (like another branch).
 
1921
    # For example, what should "log bzr://branch/dir/file1 file2" do? (Is
 
1922
    # file2 implicitly in the same dir as file1 or should its directory be
 
1923
    # taken from the current tree somehow?) For now, this solves the common
 
1924
    # case of running log in a nested directory, assuming paths beyond the
 
1925
    # first one haven't been deleted ...
 
1926
    if tree:
 
1927
        relpaths = [path] + safe_relpath_files(tree, file_list[1:])
 
1928
    else:
 
1929
        relpaths = [path] + file_list[1:]
 
1930
    info_list = []
 
1931
    start_rev_info, end_rev_info = _get_revision_range(revisionspec_list, b,
 
1932
        "log")
 
1933
    if relpaths in ([], [u'']):
 
1934
        return b, [], start_rev_info, end_rev_info
 
1935
    if start_rev_info is None and end_rev_info is None:
 
1936
        if tree is None:
 
1937
            tree = b.basis_tree()
 
1938
        tree1 = None
 
1939
        for fp in relpaths:
 
1940
            file_id = tree.path2id(fp)
 
1941
            kind = _get_kind_for_file_id(tree, file_id)
 
1942
            if file_id is None:
 
1943
                # go back to when time began
 
1944
                if tree1 is None:
 
1945
                    try:
 
1946
                        rev1 = b.get_rev_id(1)
 
1947
                    except errors.NoSuchRevision:
 
1948
                        # No history at all
 
1949
                        file_id = None
 
1950
                        kind = None
 
1951
                    else:
 
1952
                        tree1 = b.repository.revision_tree(rev1)
 
1953
                if tree1:
 
1954
                    file_id = tree1.path2id(fp)
 
1955
                    kind = _get_kind_for_file_id(tree1, file_id)
 
1956
            info_list.append((fp, file_id, kind))
 
1957
 
 
1958
    elif start_rev_info == end_rev_info:
 
1959
        # One revision given - file must exist in it
 
1960
        tree = b.repository.revision_tree(end_rev_info.rev_id)
 
1961
        for fp in relpaths:
 
1962
            file_id = tree.path2id(fp)
 
1963
            kind = _get_kind_for_file_id(tree, file_id)
 
1964
            info_list.append((fp, file_id, kind))
 
1965
 
 
1966
    else:
 
1967
        # Revision range given. Get the file-id from the end tree.
 
1968
        # If that fails, try the start tree.
 
1969
        rev_id = end_rev_info.rev_id
 
1970
        if rev_id is None:
 
1971
            tree = b.basis_tree()
 
1972
        else:
 
1973
            tree = b.repository.revision_tree(rev_id)
 
1974
        tree1 = None
 
1975
        for fp in relpaths:
 
1976
            file_id = tree.path2id(fp)
 
1977
            kind = _get_kind_for_file_id(tree, file_id)
 
1978
            if file_id is None:
 
1979
                if tree1 is None:
 
1980
                    rev_id = start_rev_info.rev_id
 
1981
                    if rev_id is None:
 
1982
                        rev1 = b.get_rev_id(1)
 
1983
                        tree1 = b.repository.revision_tree(rev1)
 
1984
                    else:
 
1985
                        tree1 = b.repository.revision_tree(rev_id)
 
1986
                file_id = tree1.path2id(fp)
 
1987
                kind = _get_kind_for_file_id(tree1, file_id)
 
1988
            info_list.append((fp, file_id, kind))
 
1989
    return b, info_list, start_rev_info, end_rev_info
 
1990
 
 
1991
 
 
1992
def _get_kind_for_file_id(tree, file_id):
 
1993
    """Return the kind of a file-id or None if it doesn't exist."""
 
1994
    if file_id is not None:
 
1995
        return tree.kind(file_id)
 
1996
    else:
 
1997
        return None
 
1998
 
 
1999
 
 
2000
properties_handler_registry = registry.Registry()
 
2001
 
 
2002
# Use the properties handlers to print out bug information if available
 
2003
def _bugs_properties_handler(revision):
 
2004
    if revision.properties.has_key('bugs'):
 
2005
        bug_lines = revision.properties['bugs'].split('\n')
 
2006
        bug_rows = [line.split(' ', 1) for line in bug_lines]
 
2007
        fixed_bug_urls = [row[0] for row in bug_rows if
 
2008
                          len(row) > 1 and row[1] == 'fixed']
 
2009
        
 
2010
        if fixed_bug_urls:
 
2011
            return {'fixes bug(s)': ' '.join(fixed_bug_urls)}
 
2012
    return {}
 
2013
 
 
2014
properties_handler_registry.register('bugs_properties_handler',
 
2015
                                     _bugs_properties_handler)
 
2016
 
 
2017
 
 
2018
# adapters which revision ids to log are filtered. When log is called, the
 
2019
# log_rev_iterator is adapted through each of these factory methods.
 
2020
# Plugins are welcome to mutate this list in any way they like - as long
 
2021
# as the overall behaviour is preserved. At this point there is no extensible
 
2022
# mechanism for getting parameters to each factory method, and until there is
 
2023
# this won't be considered a stable api.
 
2024
log_adapters = [
 
2025
    # core log logic
 
2026
    _make_batch_filter,
 
2027
    # read revision objects
 
2028
    _make_revision_objects,
 
2029
    # filter on log messages
 
2030
    _make_search_filter,
 
2031
    # generate deltas for things we will show
 
2032
    _make_delta_filter
 
2033
    ]