/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to tools/history2revfiles.py

  • Committer: John Arbash Meinel
  • Date: 2009-10-17 04:43:14 UTC
  • mto: This revision was merged to the branch mainline in revision 4756.
  • Revision ID: john@arbash-meinel.com-20091017044314-nlvrrqnz0f2wzcp4
change the GroupcompressBlock code a bit.
If the first decompress request is big enough, just decompress everything.
And when we do that, let go of the decompressobj.

After digging through the zlib code, it looks like 1 zlib stream object
contains a 5kB internal state, and another 4*64kB buffers. (about 260kB
of total state.)
That turns out to be quite a lot if you think about it.


In the case of branching a copy of 'bzr.dev' locally, this turned out
to be 383MB w/ bzr.dev and 345MB w/ only this patch. (So ~11% of peak).

Also, this was 'unreferenced' memory, because it is hidden in the
zlib internal state in working buffers. So it wasn't memory that Meliae
could find. \o/.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#! /usr/bin/python
 
2
 
 
3
# Copyright (C) 2005 Canonical Ltd
 
4
#
 
5
# This program is free software; you can redistribute it and/or modify
 
6
# it under the terms of the GNU General Public License as published by
 
7
# the Free Software Foundation; either version 2 of the License, or
 
8
# (at your option) any later version.
 
9
#
 
10
# This program is distributed in the hope that it will be useful,
 
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
# GNU General Public License for more details.
 
14
#
 
15
# You should have received a copy of the GNU General Public License
 
16
# along with this program; if not, write to the Free Software
 
17
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
18
 
 
19
"""Experiment in converting existing bzr branches to weaves."""
 
20
 
 
21
 
 
22
import bzrlib.branch
 
23
from bzrlib.revfile import Revfile
 
24
from bzrlib.progress import ProgressBar
 
25
import tempfile
 
26
import hotshot, hotshot.stats
 
27
import sys
 
28
 
 
29
def convert():
 
30
    pb = ProgressBar()
 
31
 
 
32
    inv_rf = Revfile('revfiles/inventory', 'w')
 
33
    last_text_sha = {}
 
34
    text_rfs = {}
 
35
 
 
36
    b = bzrlib.branch.find_branch('.')
 
37
 
 
38
    revno = 1
 
39
    rev_history = b.revision_history()
 
40
    last_idx = None
 
41
    for rev_id in rev_history:
 
42
        pb.update('converting inventory', revno, len(rev_history))
 
43
        inv_xml = b.get_inventory_xml(rev_id).read()
 
44
        new_idx = inv_rf.add(inv_xml, last_idx, compress=False)
 
45
 
 
46
        tree = b.revision_tree(rev_id)
 
47
        inv = tree.inventory
 
48
 
 
49
        # for each file in the inventory, put it into its own revfile
 
50
        for file_id in inv:
 
51
            ie = inv[file_id]
 
52
            if ie.kind != 'file':
 
53
                continue
 
54
            if last_text_sha.get(file_id) == ie.text_sha1:
 
55
                # same as last time
 
56
                continue
 
57
            last_text_sha[file_id] = ie.text_sha1
 
58
 
 
59
            # new text (though possibly already stored); need to store it
 
60
            text = tree.get_file(file_id).read()
 
61
            
 
62
            if file_id not in text_rfs:
 
63
                text_rfs[file_id] = Revfile('revfiles/' + file_id, 'w')
 
64
            rf = text_rfs[file_id]
 
65
 
 
66
            last = len(rf)
 
67
            if last == 0:
 
68
                last = None
 
69
            else:
 
70
                last -= 1
 
71
            rf.add(text, last, compress=True)
 
72
        
 
73
        last_idx = new_idx
 
74
        revno += 1
 
75
 
 
76
    pb.clear()
 
77
 
 
78
 
 
79
def profile_convert(): 
 
80
    prof_f = tempfile.NamedTemporaryFile()
 
81
 
 
82
    prof = hotshot.Profile(prof_f.name)
 
83
 
 
84
    prof.runcall(convert) 
 
85
    prof.close()
 
86
 
 
87
    stats = hotshot.stats.load(prof_f.name)
 
88
    #stats.strip_dirs()
 
89
    stats.sort_stats('time')
 
90
    ## XXX: Might like to write to stderr or the trace file instead but
 
91
    ## print_stats seems hardcoded to stdout
 
92
    stats.print_stats(20)
 
93
            
 
94
 
 
95
if '-p' in sys.argv[1:]:
 
96
    profile_convert()
 
97
else:
 
98
    convert()
 
99