/brz/remove-bazaar

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/tests/EncodingAdapter.py

  • Committer: Robert Collins
  • Date: 2010-05-04 06:22:51 UTC
  • mto: This revision was merged to the branch mainline in revision 5206.
  • Revision ID: robertc@robertcollins.net-20100504062251-1ocjhrl53mum9ehw
Minor local_abspath docstring improvement.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006 by Canonical Ltd
 
1
# Copyright (C) 2006 Canonical Ltd
2
2
# -*- coding: utf-8 -*-
3
 
 
 
3
#
4
4
# This program is free software; you can redistribute it and/or modify
5
5
# it under the terms of the GNU General Public License as published by
6
6
# the Free Software Foundation; either version 2 of the License, or
7
7
# (at your option) any later version.
8
 
 
 
8
#
9
9
# This program is distributed in the hope that it will be useful,
10
10
# but WITHOUT ANY WARRANTY; without even the implied warranty of
11
11
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12
12
# GNU General Public License for more details.
13
 
 
 
13
#
14
14
# You should have received a copy of the GNU General Public License
15
15
# along with this program; if not, write to the Free Software
16
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17
17
 
18
 
"""\
19
 
Adapter for running test cases against multiple encodings.
20
 
"""
 
18
"""Adapter for running test cases against multiple encodings."""
21
19
 
22
20
from copy import deepcopy
23
21
 
24
22
from bzrlib.tests import TestSuite
25
23
 
 
24
 
26
25
# prefix for micro (1/1000000)
27
26
_mu = u'\xb5'
28
27
 
 
28
# greek letter omega, not to be confused with
 
29
# the Ohm sign, u'\u2126'. Though they are probably identical
 
30
# cp437 can handle the first, but not the second
 
31
_omega = u'\u03a9'
 
32
 
 
33
# smallest error possible, epsilon
 
34
# cp437 handles u03b5, but not u2208 the 'element of' operator
 
35
_epsilon = u'\u03b5'
 
36
 
29
37
# Swedish?
30
38
_erik = u'Erik B\xe5gfors'
31
39
 
40
48
 
41
49
# Russian, 'Alexander' in russian
42
50
_alexander = u'\u0410\u043b\u0435\u043a\u0441\u0430\u043d\u0434\u0440'
43
 
# No idea if this means anything, but we need another string
44
 
_alex = u'\u0410\u043b\u0435\u043a'
 
51
# The word 'test' in Russian
 
52
_russian_test = u'\u0422\u0435\u0441\u0442'
45
53
 
46
54
# Kanji
47
55
# It is a kanji sequence for nihonjin, or Japanese in English.
48
 
 
56
#
49
57
# '\u4eba' being person, 'u\65e5' sun and '\u672c' origin. Ie,
50
58
# sun-origin-person, 'native from the land where the sun rises'. Note, I'm
51
59
# not a fluent speaker, so this is just my crude breakdown.
52
 
 
60
#
53
61
# Wouter van Heyst
54
62
_nihonjin = u'\u65e5\u672c\u4eba'
55
63
 
71
79
_shalom = u'\u05e9\u05dc\u05d5\u05dd'
72
80
 
73
81
 
74
 
class EncodingTestAdapter(object):
75
 
    """A tool to generate a suite, testing multiple encodings for a single test.
76
 
    
77
 
    This is similar to bzrlib.transport.TransportTestProviderAdapter.
78
 
    It is done by copying the test once for each encoding, and injecting
79
 
    the encoding name, and the list of valid strings for that encoding.
80
 
    Each copy is also given a new id() to make it easy to identify.
81
 
    """
82
 
 
83
 
    _encodings = [
 
82
encoding_scenarios = [
84
83
        # Permutation 1 of utf-8
85
 
        ('utf-8', 1, {'committer':_erik
86
 
                  , 'message':_yellow_horse
87
 
                  , 'filename':_shrimp_sandwich
88
 
                  , 'directory':_nihonjin}),
 
84
        ('utf-8,1', {
 
85
            'info': {
 
86
                'committer': _erik,
 
87
                'message': _yellow_horse,
 
88
                'filename': _shrimp_sandwich,
 
89
                'directory': _nihonjin,
 
90
                },
 
91
            'encoding': 'utf-8',
 
92
            }),
89
93
        # Permutation 2 of utf-8
90
 
        ('utf-8', 2, {'committer':_alexander
91
 
                  , 'message':u'Testing ' + _mu
92
 
                  , 'filename':_shalom
93
 
                  , 'directory':_juju}),
94
 
        ('iso-8859-1', 0, {'committer':_erik
95
 
                  , 'message':u'Testing ' + _mu
96
 
                  , 'filename':_juju_alt
97
 
                  , 'directory':_shrimp_sandwich}),
98
 
        ('iso-8859-2', 0, {'committer':_someone
99
 
                  , 'message':_yellow_horse
100
 
                  , 'filename':_yellow
101
 
                  , 'directory':_something}),
102
 
        ('cp1251', 0, {'committer':_alexander
103
 
                  , 'message':u'Testing ' + _mu
104
 
                  , 'filename':_alex
105
 
                  , 'directory':_alex + 'dir'}),
 
94
        ('utf-8,2', {
 
95
            'info': {
 
96
                'committer': _alexander,
 
97
                'message': u'Testing ' + _mu,
 
98
                'filename': _shalom,
 
99
                'directory': _juju,
 
100
                },
 
101
            'encoding': 'utf-8',
 
102
            }),
 
103
        ('iso-8859-1', {
 
104
            'info': {
 
105
                'committer': _erik,
 
106
                'message': u'Testing ' + _mu,
 
107
                'filename': _juju_alt,
 
108
                'directory': _shrimp_sandwich,
 
109
                },
 
110
            'encoding': 'iso-8859-1',
 
111
            }),
 
112
        ('iso-8859-2', {
 
113
            'info': {
 
114
                'committer': _someone,
 
115
                'message': _yellow_horse,
 
116
                'filename': _yellow,
 
117
                'directory': _something,
 
118
                },
 
119
            'encoding': 'iso-8859-2',
 
120
            }),
 
121
        ('cp1251', {
 
122
            'info': {
 
123
                'committer': _alexander,
 
124
                'message': u'Testing ' + _mu,
 
125
                'filename': _russian_test,
 
126
                'directory': _russian_test + 'dir',
 
127
                },
 
128
            'encoding': 'cp1251',
 
129
            }),
 
130
# The iso-8859-1 tests run on a default windows cp437 installation
 
131
# and it takes a long time to run an extra permutation of the tests
 
132
# But just in case we want to add this back in:
 
133
#        ('cp437', {'committer':_erik
 
134
#                  , 'message':u'Testing ' + _mu
 
135
#                  , 'filename':'file_' + _omega
 
136
#                  , 'directory':_epsilon + '_dir',
 
137
#            'encoding': 'cp437'}),
106
138
    ]
107
 
 
108
 
    def adapt(self, test):
109
 
        result = TestSuite()
110
 
        for encoding, count, info in self._encodings:
111
 
            new_test = deepcopy(test)
112
 
            new_test.encoding = encoding
113
 
            new_test.info = info
114
 
            def make_new_test_id():
115
 
                if count:
116
 
                    new_id = "%s(%s,%s)" % (new_test.id(), encoding, count)
117
 
                else:
118
 
                    new_id = "%s(%s)" % (new_test.id(), encoding)
119
 
                return lambda: new_id
120
 
            new_test.id = make_new_test_id()
121
 
            result.addTest(new_test)
122
 
        return result
123
 
 
124