/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to breezy/lsprof.py

  • Committer: Jelmer Vernooij
  • Date: 2018-05-19 13:16:11 UTC
  • mto: (6968.4.3 git-archive)
  • mto: This revision was merged to the branch mainline in revision 6972.
  • Revision ID: jelmer@jelmer.uk-20180519131611-l9h9ud41j7qg1m03
Move tar/zip to breezy.archive.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# this is copied from the lsprof distro because somehow
 
2
# it is not installed by distutils
 
3
# I made one modification to profile so that it returns a pair
 
4
# instead of just the Stats object
 
5
 
 
6
from __future__ import absolute_import
 
7
 
 
8
import codecs
 
9
try:
 
10
    import cPickle as pickle
 
11
except ImportError:
 
12
    import pickle
 
13
import operator
 
14
import os
 
15
import sys
 
16
try:
 
17
    import _thread
 
18
except ImportError:
 
19
    import thread as _thread
 
20
import threading
 
21
from _lsprof import Profiler, profiler_entry
 
22
 
 
23
from . import errors
 
24
 
 
25
__all__ = ['profile', 'Stats']
 
26
 
 
27
def profile(f, *args, **kwds):
 
28
    """Run a function profile.
 
29
 
 
30
    Exceptions are not caught: If you need stats even when exceptions are to be
 
31
    raised, pass in a closure that will catch the exceptions and transform them
 
32
    appropriately for your driver function.
 
33
 
 
34
    Important caveat: only one profile can execute at a time. See BzrProfiler
 
35
    for details.
 
36
 
 
37
    :return: The functions return value and a stats object.
 
38
    """
 
39
    profiler = BzrProfiler()
 
40
    profiler.start()
 
41
    try:
 
42
        ret = f(*args, **kwds)
 
43
    finally:
 
44
        stats = profiler.stop()
 
45
    return ret, stats
 
46
 
 
47
 
 
48
class BzrProfiler(object):
 
49
    """Bzr utility wrapper around Profiler.
 
50
    
 
51
    For most uses the module level 'profile()' function will be suitable.
 
52
    However profiling when a simple wrapped function isn't available may
 
53
    be easier to accomplish using this class.
 
54
 
 
55
    To use it, create a BzrProfiler and call start() on it. Some arbitrary
 
56
    time later call stop() to stop profiling and retrieve the statistics
 
57
    from the code executed in the interim.
 
58
 
 
59
    Note that profiling involves a threading.Lock around the actual profiling.
 
60
    This is needed because profiling involves global manipulation of the python
 
61
    interpreter state. As such you cannot perform multiple profiles at once.
 
62
    Trying to do so will lock out the second profiler unless the global 
 
63
    breezy.lsprof.BzrProfiler.profiler_block is set to 0. Setting it to 0 will
 
64
    cause profiling to fail rather than blocking.
 
65
    """
 
66
 
 
67
    profiler_block = 1
 
68
    """Serialise rather than failing to profile concurrent profile requests."""
 
69
 
 
70
    profiler_lock = threading.Lock()
 
71
    """Global lock used to serialise profiles."""
 
72
 
 
73
    def start(self):
 
74
        """Start profiling.
 
75
        
 
76
        This hooks into threading and will record all calls made until
 
77
        stop() is called.
 
78
        """
 
79
        self._g_threadmap = {}
 
80
        self.p = Profiler()
 
81
        permitted = self.__class__.profiler_lock.acquire(
 
82
            self.__class__.profiler_block)
 
83
        if not permitted:
 
84
            raise errors.InternalBzrError(msg="Already profiling something")
 
85
        try:
 
86
            self.p.enable(subcalls=True)
 
87
            threading.setprofile(self._thread_profile)
 
88
        except:
 
89
            self.__class__.profiler_lock.release()
 
90
            raise
 
91
 
 
92
    def stop(self):
 
93
        """Stop profiling.
 
94
 
 
95
        This unhooks from threading and cleans up the profiler, returning
 
96
        the gathered Stats object.
 
97
 
 
98
        :return: A breezy.lsprof.Stats object.
 
99
        """
 
100
        try:
 
101
            self.p.disable()
 
102
            for pp in self._g_threadmap.values():
 
103
                pp.disable()
 
104
            threading.setprofile(None)
 
105
            p = self.p
 
106
            self.p = None
 
107
            threads = {}
 
108
            for tid, pp in self._g_threadmap.items():
 
109
                threads[tid] = Stats(pp.getstats(), {})
 
110
            self._g_threadmap = None
 
111
            return Stats(p.getstats(), threads)
 
112
        finally:
 
113
            self.__class__.profiler_lock.release()
 
114
 
 
115
    def _thread_profile(self, f, *args, **kwds):
 
116
        # we lose the first profile point for a new thread in order to
 
117
        # trampoline a new Profile object into place
 
118
        thr = _thread.get_ident()
 
119
        self._g_threadmap[thr] = p = Profiler()
 
120
        # this overrides our sys.setprofile hook:
 
121
        p.enable(subcalls=True, builtins=True)
 
122
 
 
123
 
 
124
class Stats(object):
 
125
    """Wrapper around the collected data.
 
126
 
 
127
    A Stats instance is created when the profiler finishes. Normal
 
128
    usage is to use save() to write out the data to a file, or pprint()
 
129
    to write human-readable information to the command line.
 
130
    """
 
131
 
 
132
    def __init__(self, data, threads):
 
133
        self.data = data
 
134
        self.threads = threads
 
135
 
 
136
    def sort(self, crit="inlinetime", reverse=True):
 
137
        """Sort the data by the supplied critera.
 
138
 
 
139
        :param crit: the data attribute used as the sort key."""
 
140
        if crit not in profiler_entry.__dict__ or crit == 'code':
 
141
            raise ValueError("Can't sort by %s" % crit)
 
142
 
 
143
        key_func = operator.attrgetter(crit)
 
144
        self.data.sort(key=key_func, reverse=reverse)
 
145
 
 
146
        for e in self.data:
 
147
            if e.calls:
 
148
                e.calls.sort(key=key_func, reverse=reverse)
 
149
 
 
150
    def pprint(self, top=None, file=None):
 
151
        """Pretty-print the data as plain text for human consumption.
 
152
 
 
153
        :param top: only output the top n entries.
 
154
            The default value of None means output all data.
 
155
        :param file: the output file; if None, output will
 
156
            default to stdout."""
 
157
        if file is None:
 
158
            file = sys.stdout
 
159
        d = self.data
 
160
        if top is not None:
 
161
            d = d[:top]
 
162
        cols = "% 12s %12s %11.4f %11.4f   %s\n"
 
163
        hcols = "% 12s %12s %12s %12s %s\n"
 
164
        cols2 = "+%12s %12s %11.4f %11.4f +  %s\n"
 
165
        file.write(hcols % ("CallCount", "Recursive", "Total(ms)",
 
166
                            "Inline(ms)", "module:lineno(function)"))
 
167
        for e in d:
 
168
            file.write(cols % (e.callcount, e.reccallcount, e.totaltime,
 
169
                               e.inlinetime, label(e.code)))
 
170
            if e.calls:
 
171
                for se in e.calls:
 
172
                    file.write(cols % ("+%s" % se.callcount, se.reccallcount,
 
173
                                       se.totaltime, se.inlinetime,
 
174
                                       "+%s" % label(se.code)))
 
175
 
 
176
    def freeze(self):
 
177
        """Replace all references to code objects with string
 
178
        descriptions; this makes it possible to pickle the instance."""
 
179
 
 
180
        # this code is probably rather ickier than it needs to be!
 
181
        for i in range(len(self.data)):
 
182
            e = self.data[i]
 
183
            if not isinstance(e.code, str):
 
184
                self.data[i] = type(e)((label(e.code),) + e[1:])
 
185
            if e.calls:
 
186
                for j in range(len(e.calls)):
 
187
                    se = e.calls[j]
 
188
                    if not isinstance(se.code, str):
 
189
                        e.calls[j] = type(se)((label(se.code),) + se[1:])
 
190
        for s in self.threads.values():
 
191
            s.freeze()
 
192
 
 
193
    def calltree(self, file):
 
194
        """Output profiling data in calltree format (for KCacheGrind)."""
 
195
        _CallTreeFilter(self.data).output(file)
 
196
 
 
197
    def save(self, filename, format=None):
 
198
        """Save profiling data to a file.
 
199
 
 
200
        :param filename: the name of the output file
 
201
        :param format: 'txt' for a text representation;
 
202
            'callgrind' for calltree format;
 
203
            otherwise a pickled Python object. A format of None indicates
 
204
            that the format to use is to be found from the filename. If
 
205
            the name starts with callgrind.out, callgrind format is used
 
206
            otherwise the format is given by the filename extension.
 
207
        """
 
208
        if format is None:
 
209
            basename = os.path.basename(filename)
 
210
            if basename.startswith('callgrind.out'):
 
211
                format = "callgrind"
 
212
            else:
 
213
                ext = os.path.splitext(filename)[1]
 
214
                if len(ext) > 1:
 
215
                    format = ext[1:]
 
216
        with open(filename, 'wb') as outfile:
 
217
            if format == "callgrind":
 
218
                # The callgrind format states it is 'ASCII based':
 
219
                # <http://valgrind.org/docs/manual/cl-format.html>
 
220
                # But includes filenames so lets ignore and use UTF-8.
 
221
                self.calltree(codecs.getwriter('utf-8')(outfile))
 
222
            elif format == "txt":
 
223
                self.pprint(file=codecs.getwriter('utf-8')(outfile))
 
224
            else:
 
225
                self.freeze()
 
226
                pickle.dump(self, outfile, 2)
 
227
 
 
228
 
 
229
class _CallTreeFilter(object):
 
230
    """Converter of a Stats object to input suitable for KCacheGrind.
 
231
 
 
232
    This code is taken from http://ddaa.net/blog/python/lsprof-calltree
 
233
    with the changes made by J.P. Calderone and Itamar applied. Note that
 
234
    isinstance(code, str) needs to be used at times to determine if the code
 
235
    object is actually an external code object (with a filename, etc.) or
 
236
    a Python built-in.
 
237
    """
 
238
 
 
239
    def __init__(self, data):
 
240
        self.data = data
 
241
        self.out_file = None
 
242
 
 
243
    def output(self, out_file):
 
244
        self.out_file = out_file
 
245
        out_file.write('events: Ticks\n')
 
246
        self._print_summary()
 
247
        for entry in self.data:
 
248
            self._entry(entry)
 
249
 
 
250
    def _print_summary(self):
 
251
        max_cost = 0
 
252
        for entry in self.data:
 
253
            totaltime = int(entry.totaltime * 1000)
 
254
            max_cost = max(max_cost, totaltime)
 
255
        self.out_file.write('summary: %d\n' % (max_cost,))
 
256
 
 
257
    def _entry(self, entry):
 
258
        out_file = self.out_file
 
259
        code = entry.code
 
260
        inlinetime = int(entry.inlinetime * 1000)
 
261
        #out_file.write('ob=%s\n' % (code.co_filename,))
 
262
        if isinstance(code, str):
 
263
            out_file.write('fi=~\n')
 
264
        else:
 
265
            out_file.write('fi=%s\n' % (code.co_filename,))
 
266
        out_file.write('fn=%s\n' % (label(code, True),))
 
267
        if isinstance(code, str):
 
268
            out_file.write('0  %s\n' % (inlinetime,))
 
269
        else:
 
270
            out_file.write('%d %d\n' % (code.co_firstlineno, inlinetime))
 
271
        # recursive calls are counted in entry.calls
 
272
        if entry.calls:
 
273
            calls = entry.calls
 
274
        else:
 
275
            calls = []
 
276
        if isinstance(code, str):
 
277
            lineno = 0
 
278
        else:
 
279
            lineno = code.co_firstlineno
 
280
        for subentry in calls:
 
281
            self._subentry(lineno, subentry)
 
282
        out_file.write('\n')
 
283
 
 
284
    def _subentry(self, lineno, subentry):
 
285
        out_file = self.out_file
 
286
        code = subentry.code
 
287
        totaltime = int(subentry.totaltime * 1000)
 
288
        #out_file.write('cob=%s\n' % (code.co_filename,))
 
289
        if isinstance(code, str):
 
290
            out_file.write('cfi=~\n')
 
291
            out_file.write('cfn=%s\n' % (label(code, True),))
 
292
            out_file.write('calls=%d 0\n' % (subentry.callcount,))
 
293
        else:
 
294
            out_file.write('cfi=%s\n' % (code.co_filename,))
 
295
            out_file.write('cfn=%s\n' % (label(code, True),))
 
296
            out_file.write('calls=%d %d\n' % (
 
297
                subentry.callcount, code.co_firstlineno))
 
298
        out_file.write('%d %d\n' % (lineno, totaltime))
 
299
 
 
300
_fn2mod = {}
 
301
 
 
302
def label(code, calltree=False):
 
303
    if isinstance(code, str):
 
304
        return code
 
305
    try:
 
306
        mname = _fn2mod[code.co_filename]
 
307
    except KeyError:
 
308
        for k, v in sys.modules.items():
 
309
            if v is None:
 
310
                continue
 
311
            if getattr(v, '__file__', None) is None:
 
312
                continue
 
313
            if not isinstance(v.__file__, str):
 
314
                continue
 
315
            if v.__file__.startswith(code.co_filename):
 
316
                mname = _fn2mod[code.co_filename] = k
 
317
                break
 
318
        else:
 
319
            mname = _fn2mod[code.co_filename] = '<%s>'%code.co_filename
 
320
    if calltree:
 
321
        return '%s %s:%d' % (code.co_name, mname, code.co_firstlineno)
 
322
    else:
 
323
        return '%s:%d(%s)' % (mname, code.co_firstlineno, code.co_name)
 
324
 
 
325
 
 
326
def main():
 
327
    sys.argv = sys.argv[1:]
 
328
    if not sys.argv:
 
329
        sys.stderr.write("usage: lsprof.py <script> <arguments...>\n")
 
330
        sys.exit(2)
 
331
    import runpy
 
332
    result, stats = profile(runpy.run_path, sys.argv[0], run_name='__main__')
 
333
    stats.sort()
 
334
    stats.pprint()
 
335
 
 
336
 
 
337
if __name__ == '__main__':
 
338
    main()