/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/textfile.py

  • Committer: John Arbash Meinel
  • Date: 2009-10-17 04:43:14 UTC
  • mto: This revision was merged to the branch mainline in revision 4756.
  • Revision ID: john@arbash-meinel.com-20091017044314-nlvrrqnz0f2wzcp4
change the GroupcompressBlock code a bit.
If the first decompress request is big enough, just decompress everything.
And when we do that, let go of the decompressobj.

After digging through the zlib code, it looks like 1 zlib stream object
contains a 5kB internal state, and another 4*64kB buffers. (about 260kB
of total state.)
That turns out to be quite a lot if you think about it.


In the case of branching a copy of 'bzr.dev' locally, this turned out
to be 383MB w/ bzr.dev and 345MB w/ only this patch. (So ~11% of peak).

Also, this was 'unreferenced' memory, because it is hidden in the
zlib internal state in working buffers. So it wasn't memory that Meliae
could find. \o/.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2006 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
16
 
 
17
"""Utilities for distinguishing binary files from text files"""
 
18
 
 
19
from itertools import chain
 
20
 
 
21
from bzrlib.errors import BinaryFile
 
22
from bzrlib.iterablefile import IterableFile
 
23
from bzrlib.osutils import file_iterator
 
24
 
 
25
 
 
26
def text_file(input):
 
27
    """Produce a file iterator that is guaranteed to be text, without seeking.
 
28
    BinaryFile is raised if the file contains a NUL in the first 1024 bytes.
 
29
    """
 
30
    first_chunk = input.read(1024)
 
31
    if '\x00' in first_chunk:
 
32
        raise BinaryFile()
 
33
    return IterableFile(chain((first_chunk,), file_iterator(input)))
 
34
 
 
35
 
 
36
def check_text_lines(lines):
 
37
    """Raise BinaryFile if the supplied lines contain NULs.
 
38
    Only the first 1024 characters are checked.
 
39
    """
 
40
    f = IterableFile(lines)
 
41
    if '\x00' in f.read(1024):
 
42
        raise BinaryFile()
 
43
 
 
44
 
 
45
def check_text_path(path):
 
46
    """Check whether the supplied path is a text, not binary file.
 
47
    Raise BinaryFile if a NUL occurs in the first 1024 bytes.
 
48
    """
 
49
    f = open(path, 'rb')
 
50
    try:
 
51
        text_file(f)
 
52
    finally:
 
53
        f.close()