/brz/remove-bazaar : revision 3224.5.16

To get this branch, use:

bzr branch
http://gegoxaren.bato24.eu/bzr/brz/remove-bazaar

« back to all changes in this revision

Viewing changes to bzrlib/index.py

Committer: Andrew Bennetts
Date: 2008-09-08 12:59:00 UTC
mfrom: (3695 +trunk)
mto: This revision was merged to the branch mainline in revision 3756.
Revision ID: andrew.bennetts@canonical.com-20080908125900-8ywtsr7jqyyatjz0

Merge from bzr.dev.

files added:
bzrlib/_btree_serializer_c.pyx

bzrlib/_btree_serializer_py.py

bzrlib/_readdir_py.py

bzrlib/_readdir_pyx.pyx

bzrlib/_walkdirs_win32.h

bzrlib/_walkdirs_win32.pyx

bzrlib/btree_index.py

bzrlib/chunk_writer.py

bzrlib/help_topics/en/patterns.txt

bzrlib/help_topics/en/rules.txt

bzrlib/push.py

bzrlib/readdir.h

bzrlib/rules.py

bzrlib/smart/message.py

bzrlib/tests/blackbox/test_alias.py

bzrlib/tests/blackbox/test_modified.py

bzrlib/tests/branch_implementations/test_check.py

bzrlib/tests/branch_implementations/test_reconcile.py

bzrlib/tests/branch_implementations/test_stacking.py

bzrlib/tests/file_utils.py

bzrlib/tests/interrepository_implementations/test_fetch.py

bzrlib/tests/per_repository_reference

bzrlib/tests/per_repository_reference/__init__.py

bzrlib/tests/per_repository_reference/test_add_inventory.py

bzrlib/tests/per_repository_reference/test_add_revision.py

bzrlib/tests/per_repository_reference/test_add_signature_text.py

bzrlib/tests/per_repository_reference/test_all_revision_ids.py

bzrlib/tests/per_repository_reference/test_break_lock.py

bzrlib/tests/per_repository_reference/test_check.py

bzrlib/tests/repository_implementations/test_add_fallback_repository.py

bzrlib/tests/repository_implementations/test_get_parent_map.py

bzrlib/tests/test__walkdirs_win32.py

bzrlib/tests/test_btree_index.py

bzrlib/tests/test_chunk_writer.py

bzrlib/tests/test_mutabletree.py

bzrlib/tests/test_pack_repository.py

bzrlib/tests/test_rules.py

bzrlib/tests/test_transport_log.py

bzrlib/tests/test_upgrade_stacked.py

bzrlib/tests/tree_implementations/test_iter_search_rules.py

bzrlib/transport/ftp

bzrlib/transport/ftp/_gssapi.py

bzrlib/transport/log.py

bzrlib/xml5.py

bzrlib/xml6.py

contrib/bash/bzrbashprompt.sh

doc/developers/integration.txt

doc/developers/overview.txt

doc/developers/plugin-api.txt

doc/developers/ppa.txt

doc/developers/releasing.txt

doc/developers/repository-stream.txt

doc/developers/testing.txt

doc/developers/tortoise-strategy.txt

doc/en/user-guide/bzrtools_plugin.txt

doc/en/user-guide/stacked.txt

doc/en/user-guide/svn_plugin.txt

doc/en/user-guide/web_browsing.txt

doc/es

doc/es/guia-desarrollador

doc/es/guia-usuario

doc/es/guia-usuario/index.txt

doc/es/guia-usuario/resolving_conflicts.txt

doc/es/guia-usuario/version_info.txt

doc/es/mini-tutorial

doc/es/mini-tutorial/index.txt

doc/es/notas-version

doc/es/referencia

doc/es/referencia-rapida

doc/es/referencia-rapida/Makefile

doc/es/referencia-rapida/referencia-rapida.svg

doc/index.es.txt

tools/packaging

tools/packaging/build-packages.sh

tools/packaging/update-changelogs.sh

tools/packaging/update-packaging-branches.sh

tools/win32/run_script.py

files removed:
bzrlib/store/revision/__init__.py

bzrlib/store/revision/knit.py

bzrlib/store/revision/text.py

bzrlib/tests/interversionedfile_implementations

bzrlib/tests/interversionedfile_implementations/__init__.py

bzrlib/tests/interversionedfile_implementations/test_join.py

bzrlib/tests/revisionstore_implementations

bzrlib/tests/revisionstore_implementations/__init__.py

bzrlib/tests/revisionstore_implementations/test_all.py

bzrlib/tests/test_escaped_store.py

bzrlib/xml6.py

tools/win32/survey.txt

files renamed:
bzrlib/transport/ftp.py => bzrlib/transport/ftp/__init__.py

bzrlib/xml5.py => bzrlib/xml8.py

doc/en/user-guide/best_practice_intro.txt => doc/en/user-guide/part2_intro.txt

doc/en/user-guide/revnos.txt => doc/en/user-guide/zen.txt

files modified:
.bzrignore

Makefile

NEWS

bzrlib/__init__.py

bzrlib/_dirstate_helpers_c.pyx

bzrlib/_dirstate_helpers_py.py

bzrlib/_patiencediff_c.c

bzrlib/_patiencediff_py.py

bzrlib/add.py

bzrlib/annotate.py

bzrlib/atomicfile.py

bzrlib/benchmarks/bench_bundle.py

bzrlib/benchmarks/bench_osutils.py

bzrlib/benchmarks/tree_creator/kernel_like.py

bzrlib/branch.py

bzrlib/branchbuilder.py

bzrlib/builtins.py

bzrlib/bundle/bundle_data.py

bzrlib/bundle/serializer/v08.py

bzrlib/bundle/serializer/v4.py

bzrlib/bzrdir.py

bzrlib/check.py

bzrlib/commands.py

bzrlib/commit.py

bzrlib/config.py

bzrlib/counted_lock.py

bzrlib/debug.py

bzrlib/decorators.py

bzrlib/delta.py

bzrlib/deprecated_graph.py

bzrlib/diff.py

bzrlib/directory_service.py

bzrlib/dirstate.py

bzrlib/doc/__init__.py

bzrlib/doc/api/__init__.py

bzrlib/errors.py

bzrlib/export/__init__.py

bzrlib/export/dir_exporter.py

bzrlib/export/tar_exporter.py

bzrlib/export/zip_exporter.py

bzrlib/fetch.py

bzrlib/globbing.py

bzrlib/graph.py

bzrlib/hashcache.py

bzrlib/help.py

bzrlib/help_topics/__init__.py

bzrlib/help_topics/en/authentication.txt

bzrlib/help_topics/en/configuration.txt

bzrlib/help_topics/en/hooks.txt

bzrlib/hooks.py

bzrlib/ignores.py

bzrlib/index.py

bzrlib/info.py

bzrlib/intset.py

bzrlib/inventory.py

bzrlib/knit.py

bzrlib/lazy_import.py

bzrlib/lazy_regex.py

bzrlib/lock.py

bzrlib/lockable_files.py

bzrlib/lockdir.py

bzrlib/log.py

bzrlib/lru_cache.py

bzrlib/lsprof.py

bzrlib/mail_client.py

bzrlib/memorytree.py

bzrlib/merge.py

bzrlib/merge3.py

bzrlib/merge_directive.py

bzrlib/missing.py

bzrlib/msgeditor.py

bzrlib/multiparent.py

bzrlib/mutabletree.py

bzrlib/option.py

bzrlib/osutils.py

bzrlib/patches.py

bzrlib/plugin.py

bzrlib/plugins/launchpad/lp_directory.py

bzrlib/plugins/launchpad/lp_registration.py

bzrlib/plugins/launchpad/test_register.py

bzrlib/progress.py

bzrlib/reconcile.py

bzrlib/reconfigure.py

bzrlib/remote.py

bzrlib/repofmt/knitrepo.py

bzrlib/repofmt/pack_repo.py

bzrlib/repofmt/weaverepo.py

bzrlib/repository.py

bzrlib/revision.py

bzrlib/revisionspec.py

bzrlib/revisiontree.py

bzrlib/rio.py

bzrlib/smart/branch.py

bzrlib/smart/client.py

bzrlib/smart/medium.py

bzrlib/smart/protocol.py

bzrlib/smart/repository.py

bzrlib/smart/request.py

bzrlib/smart/server.py

bzrlib/status.py

bzrlib/store/__init__.py

bzrlib/store/text.py

bzrlib/store/versioned/__init__.py

bzrlib/symbol_versioning.py

bzrlib/tag.py

bzrlib/testament.py

bzrlib/tests/TestUtil.py

bzrlib/tests/__init__.py

bzrlib/tests/blackbox/__init__.py

bzrlib/tests/blackbox/test_added.py

bzrlib/tests/blackbox/test_branch.py

bzrlib/tests/blackbox/test_cat_revision.py

bzrlib/tests/blackbox/test_check.py

bzrlib/tests/blackbox/test_commit.py

bzrlib/tests/blackbox/test_export.py

bzrlib/tests/blackbox/test_hooks.py

bzrlib/tests/blackbox/test_info.py

bzrlib/tests/blackbox/test_init.py

bzrlib/tests/blackbox/test_locale.py

bzrlib/tests/blackbox/test_log.py

bzrlib/tests/blackbox/test_ls.py

bzrlib/tests/blackbox/test_merge.py

bzrlib/tests/blackbox/test_missing.py

bzrlib/tests/blackbox/test_non_ascii.py

bzrlib/tests/blackbox/test_outside_wt.py

bzrlib/tests/blackbox/test_push.py

bzrlib/tests/blackbox/test_reconcile.py

bzrlib/tests/blackbox/test_reconfigure.py

bzrlib/tests/blackbox/test_remove.py

bzrlib/tests/blackbox/test_selftest.py

bzrlib/tests/blackbox/test_send.py

bzrlib/tests/blackbox/test_serve.py

bzrlib/tests/blackbox/test_shared_repository.py

bzrlib/tests/blackbox/test_status.py

bzrlib/tests/blackbox/test_uncommit.py

bzrlib/tests/blackbox/test_unknowns.py

bzrlib/tests/blackbox/test_version.py

bzrlib/tests/branch_implementations/__init__.py

bzrlib/tests/branch_implementations/test_branch.py

bzrlib/tests/branch_implementations/test_commit.py

bzrlib/tests/branch_implementations/test_hooks.py

bzrlib/tests/branch_implementations/test_locking.py

bzrlib/tests/branch_implementations/test_permissions.py

bzrlib/tests/branch_implementations/test_pull.py

bzrlib/tests/branch_implementations/test_push.py

bzrlib/tests/branch_implementations/test_revision_history.py

bzrlib/tests/branch_implementations/test_uncommit.py

bzrlib/tests/branch_implementations/test_update.py

bzrlib/tests/bzrdir_implementations/__init__.py

bzrlib/tests/bzrdir_implementations/test_bzrdir.py

bzrlib/tests/commands/__init__.py

bzrlib/tests/commands/test_init.py

bzrlib/tests/commands/test_init_repository.py

bzrlib/tests/commands/test_push.py

bzrlib/tests/ftp_server.py

bzrlib/tests/http_server.py

bzrlib/tests/http_utils.py

bzrlib/tests/interrepository_implementations/__init__.py

bzrlib/tests/interrepository_implementations/test_interrepository.py

bzrlib/tests/intertree_implementations/__init__.py

bzrlib/tests/intertree_implementations/test_compare.py

bzrlib/tests/inventory_implementations/__init__.py

bzrlib/tests/inventory_implementations/basics.py

bzrlib/tests/per_lock/__init__.py

bzrlib/tests/repository_implementations/__init__.py

bzrlib/tests/repository_implementations/helpers.py

bzrlib/tests/repository_implementations/test_check.py

bzrlib/tests/repository_implementations/test_check_reconcile.py

bzrlib/tests/repository_implementations/test_commit_builder.py

bzrlib/tests/repository_implementations/test_fetch.py

bzrlib/tests/repository_implementations/test_has_same_location.py

bzrlib/tests/repository_implementations/test_reconcile.py

bzrlib/tests/repository_implementations/test_repository.py

bzrlib/tests/repository_implementations/test_revision.py

bzrlib/tests/repository_implementations/test_statistics.py

bzrlib/tests/stub_sftp.py

bzrlib/tests/test__dirstate_helpers.py

bzrlib/tests/test_ancestry.py

bzrlib/tests/test_annotate.py

bzrlib/tests/test_branch.py

bzrlib/tests/test_branchbuilder.py

bzrlib/tests/test_bundle.py

bzrlib/tests/test_bzrdir.py

bzrlib/tests/test_commit.py

bzrlib/tests/test_config.py

bzrlib/tests/test_conflicts.py

bzrlib/tests/test_counted_lock.py

bzrlib/tests/test_decorators.py

bzrlib/tests/test_diff.py

bzrlib/tests/test_directory_service.py

bzrlib/tests/test_dirstate.py

bzrlib/tests/test_errors.py

bzrlib/tests/test_fetch.py

bzrlib/tests/test_globbing.py

bzrlib/tests/test_graph.py

bzrlib/tests/test_hooks.py

bzrlib/tests/test_http.py

bzrlib/tests/test_http_response.py

bzrlib/tests/test_ignores.py

bzrlib/tests/test_index.py

bzrlib/tests/test_info.py

bzrlib/tests/test_knit.py

bzrlib/tests/test_lockable_files.py

bzrlib/tests/test_lockdir.py

bzrlib/tests/test_log.py

bzrlib/tests/test_mail_client.py

bzrlib/tests/test_memorytree.py

bzrlib/tests/test_merge.py

bzrlib/tests/test_merge_core.py

bzrlib/tests/test_merge_directive.py

bzrlib/tests/test_missing.py

bzrlib/tests/test_msgeditor.py

bzrlib/tests/test_options.py

bzrlib/tests/test_osutils.py

bzrlib/tests/test_osutils_encodings.py

bzrlib/tests/test_patches.py

bzrlib/tests/test_permissions.py

bzrlib/tests/test_plugins.py

bzrlib/tests/test_read_bundle.py

bzrlib/tests/test_reconcile.py

bzrlib/tests/test_reconfigure.py

bzrlib/tests/test_registry.py

bzrlib/tests/test_remote.py

bzrlib/tests/test_repository.py

bzrlib/tests/test_revision.py

bzrlib/tests/test_revisionspec.py

bzrlib/tests/test_revisiontree.py

bzrlib/tests/test_selftest.py

bzrlib/tests/test_setup.py

bzrlib/tests/test_smart.py

bzrlib/tests/test_smart_transport.py

bzrlib/tests/test_source.py

bzrlib/tests/test_status.py

bzrlib/tests/test_store.py

bzrlib/tests/test_strace.py

bzrlib/tests/test_subsume.py

bzrlib/tests/test_switch.py

bzrlib/tests/test_symbol_versioning.py

bzrlib/tests/test_trace.py

bzrlib/tests/test_transform.py

bzrlib/tests/test_transport.py

bzrlib/tests/test_transport_implementations.py

bzrlib/tests/test_tree.py

bzrlib/tests/test_tsort.py

bzrlib/tests/test_upgrade.py

bzrlib/tests/test_urlutils.py

bzrlib/tests/test_version_info.py

bzrlib/tests/test_versionedfile.py

bzrlib/tests/test_weave.py

bzrlib/tests/test_whitebox.py

bzrlib/tests/test_workingtree.py

bzrlib/tests/test_workingtree_4.py

bzrlib/tests/test_xml.py

bzrlib/tests/transport_util.py

bzrlib/tests/tree_implementations/__init__.py

bzrlib/tests/tree_implementations/test_inv.py

bzrlib/tests/tree_implementations/test_test_trees.py

bzrlib/tests/tree_implementations/test_tree.py

bzrlib/tests/tree_implementations/test_walkdirs.py

bzrlib/tests/treeshape.py

bzrlib/tests/workingtree_implementations/__init__.py

bzrlib/tests/workingtree_implementations/test_add_reference.py

bzrlib/tests/workingtree_implementations/test_basis_inventory.py

bzrlib/tests/workingtree_implementations/test_commit.py

bzrlib/tests/workingtree_implementations/test_parents.py

bzrlib/tests/workingtree_implementations/test_remove.py

bzrlib/tests/workingtree_implementations/test_set_root_id.py

bzrlib/tests/workingtree_implementations/test_walkdirs.py

bzrlib/tests/workingtree_implementations/test_workingtree.py

bzrlib/textinv.py

bzrlib/textui.py

bzrlib/timestamp.py

bzrlib/trace.py

bzrlib/transactions.py

bzrlib/transform.py

bzrlib/transport/__init__.py

bzrlib/transport/chroot.py

bzrlib/transport/decorator.py

bzrlib/transport/fakenfs.py

bzrlib/transport/http/__init__.py

bzrlib/transport/http/_pycurl.py

bzrlib/transport/http/_urllib.py

bzrlib/transport/http/_urllib2_wrappers.py

bzrlib/transport/http/response.py

bzrlib/transport/http/wsgi.py

bzrlib/transport/local.py

bzrlib/transport/memory.py

bzrlib/transport/remote.py

bzrlib/transport/sftp.py

bzrlib/transport/ssh.py

bzrlib/transport/trace.py

bzrlib/tree.py

bzrlib/treebuilder.py

bzrlib/tsort.py

bzrlib/tuned_gzip.py

bzrlib/uncommit.py

bzrlib/upgrade.py

bzrlib/urlutils.py

bzrlib/version_info_formats/__init__.py

bzrlib/versionedfile.py

bzrlib/weave.py

bzrlib/weave_commands.py

bzrlib/weavefile.py

bzrlib/win32utils.py

bzrlib/workingtree.py

bzrlib/workingtree_4.py

bzrlib/xml4.py

bzrlib/xml_serializer.py

contrib/bzr_access

doc/default.css

doc/developers/HACKING.txt

doc/developers/authentication-ring.txt

doc/developers/development-repo.txt

doc/developers/index.txt

doc/developers/network-protocol.txt

doc/en/mini-tutorial/index.txt

doc/en/user-guide/branching_a_project.txt

doc/en/user-guide/browsing_history.txt

doc/en/user-guide/bug_trackers.txt

doc/en/user-guide/configuring_bazaar.txt

doc/en/user-guide/controlling_registration.txt

doc/en/user-guide/core_concepts.txt

doc/en/user-guide/distributed_intro.txt

doc/en/user-guide/hooks.txt

doc/en/user-guide/index.txt

doc/en/user-guide/introducing_bazaar.txt

doc/en/user-guide/organizing_branches.txt

doc/en/user-guide/partner_intro.txt

doc/en/user-guide/releasing_a_project.txt

doc/en/user-guide/sending_changes.txt

doc/en/user-guide/undoing_mistakes.txt

doc/index.txt

setup.py

tools/doc_generate/autodoc_rstx.py

tools/rst2html.py

tools/win32/bzr.iss.cog

Show diffs side-by-side

added added

removed removed

bzrlib/index.py

"""

self.reference_lists = reference_lists

self._keys = set()

# A dict of {key: (absent, ref_lists, value)}

self._nodes = {}

self._nodes_by_key = {}

self._nodes_by_key = None

self._key_length = key_elements

def _check_key(self, key):

if not element or _whitespace_re.search(element) is not None:

raise errors.BadIndexKey(element)

def add_node(self, key, value, references=()):

"""Add a node to the index.

100

:param key: The key. keys are non-empty tuples containing

101

as many whitespace-free utf8 bytestrings as the key length

102

defined for this index.

103

:param references: An iterable of iterables of keys. Each is a

104

reference to another key.

105

:param value: The value to associate with the key. It may be any

106

bytes as long as it does not contain \0 or \n.

def _get_nodes_by_key(self):

if self._nodes_by_key is None:

100

nodes_by_key = {}

101

if self.reference_lists:

102

for key, (absent, references, value) in self._nodes.iteritems():

103

if absent:

104

continue

105

key_dict = nodes_by_key

106

for subkey in key[:-1]:

107

key_dict = key_dict.setdefault(subkey, {})

108

key_dict[key[-1]] = key, value, references

109

else:

110

for key, (absent, references, value) in self._nodes.iteritems():

111

if absent:

112

continue

113

key_dict = nodes_by_key

114

for subkey in key[:-1]:

115

key_dict = key_dict.setdefault(subkey, {})

116

key_dict[key[-1]] = key, value

117

self._nodes_by_key = nodes_by_key

118

return self._nodes_by_key

119

120

def _update_nodes_by_key(self, key, value, node_refs):

121

"""Update the _nodes_by_key dict with a new key.

122

123

For a key of (foo, bar, baz) create

124

_nodes_by_key[foo][bar][baz] = key_value

125

"""

126

if self._nodes_by_key is None:

127

return

128

key_dict = self._nodes_by_key

129

if self.reference_lists:

130

key_value = key, value, node_refs

131

else:

132

key_value = key, value

133

for subkey in key[:-1]:

134

key_dict = key_dict.setdefault(subkey, {})

135

key_dict[key[-1]] = key_value

136

137

def _check_key_ref_value(self, key, references, value):

138

"""Check that 'key' and 'references' are all valid.

139

140

:param key: A key tuple. Must conform to the key interface (be a tuple,

141

be of the right length, not have any whitespace or nulls in any key

142

element.)

143

:param references: An iterable of reference lists. Something like

144

[[(ref, key)], [(ref, key), (other, key)]]

145

:param value: The value associate with this key. Must not contain

146

newlines or null characters.

147

:return: (node_refs, absent_references)

148

node_refs basically a packed form of 'references' where all

149

iterables are tuples

150

absent_references reference keys that are not in self._nodes.

151

This may contain duplicates if the same key is

152

referenced in multiple lists.

107

153

"""

108

154

self._check_key(key)

109

155

if _newline_null_re.search(value) is not None:

111

157

if len(references) != self.reference_lists:

112

158

raise errors.BadIndexValue(references)

113

159

node_refs = []

160

absent_references = []

114

161

for reference_list in references:

115

162

for reference in reference_list:

116

self._check_key(reference)

163

# If reference *is* in self._nodes, then we know it has already

164

# been checked.

117

165

if reference not in self._nodes:

118

self._nodes[reference] = ('a', (), '')

166

self._check_key(reference)

167

absent_references.append(reference)

119

168

node_refs.append(tuple(reference_list))

120

if key in self._nodes and self._nodes[key][0] == '':

169

return tuple(node_refs), absent_references

170

171

def add_node(self, key, value, references=()):

172

"""Add a node to the index.

173

174

:param key: The key. keys are non-empty tuples containing

175

as many whitespace-free utf8 bytestrings as the key length

176

defined for this index.

177

:param references: An iterable of iterables of keys. Each is a

178

reference to another key.

179

:param value: The value to associate with the key. It may be any

180

bytes as long as it does not contain \0 or \n.

181

"""

182

(node_refs,

183

absent_references) = self._check_key_ref_value(key, references, value)

184

if key in self._nodes and self._nodes[key][0] != 'a':

121

185

raise errors.BadIndexDuplicateKey(key, self)

122

self._nodes[key] = ('', tuple(node_refs), value)

186

for reference in absent_references:

187

# There may be duplicates, but I don't think it is worth worrying

188

# about

189

self._nodes[reference] = ('a', (), '')

190

self._nodes[key] = ('', node_refs, value)

123

191

self._keys.add(key)

124

if self._key_length > 1:

125

key_dict = self._nodes_by_key

126

if self.reference_lists:

127

key_value = key, value, tuple(node_refs)

128

else:

129

key_value = key, value

130

# possibly should do this on-demand, but it seems likely it is

131

# always wanted

132

# For a key of (foo, bar, baz) create

133

# _nodes_by_key[foo][bar][baz] = key_value

134

for subkey in key[:-1]:

135

key_dict = key_dict.setdefault(subkey, {})

136

key_dict[key[-1]] = key_value

192

if self._nodes_by_key is not None and self._key_length > 1:

193

self._update_nodes_by_key(key, value, node_refs)

137

194

138

195

def finish(self):

139

196

lines = [_SIGNATURE]

142

199

lines.append(_OPTION_LEN + str(len(self._keys)) + '\n')

143

200

prefix_length = sum(len(x) for x in lines)

144

201

# references are byte offsets. To avoid having to do nasty

145

# polynomial work to resolve offsets (references to later in the

202

# polynomial work to resolve offsets (references to later in the

146

203

# file cannot be determined until all the inbetween references have

147

204

# been calculated too) we pad the offsets with 0's to make them be

148

205

# of consistent length. Using binary offsets would break the trivial

219

276

raise errors.BzrError('Failed index creation. Internal error:'

220

277

' mismatched output length and expected length: %d %d' %

221

278

(len(result.getvalue()), expected_bytes))

222

return StringIO(''.join(lines))

279

return result

223

280

224

281

225

282

class GraphIndex(object):

272

329

self._keys_by_offset = None

273

330

self._nodes_by_key = None

274

331

self._size = size

332

# The number of bytes we've read so far in trying to process this file

333

self._bytes_read = 0

275

334

276

335

def __eq__(self, other):

277

336

"""Equal when self and other were created with the same parameters."""

284

343

def __ne__(self, other):

285

344

return not self.__eq__(other)

286

345

287

def _buffer_all(self):

346

def __repr__(self):

347

return "%s(%r)" % (self.__class__.__name__,

348

self._transport.abspath(self._name))

349

350

def _buffer_all(self, stream=None):

288

351

"""Buffer all the index data.

289

352

290

353

Mutates self._nodes and self.keys_by_offset.

291

354

"""

355

if self._nodes is not None:

356

# We already did this

357

return

292

358

if 'index' in debug.debug_flags:

293

359

mutter('Reading entire index %s', self._transport.abspath(self._name))

294

stream = self._transport.get(self._name)

360

if stream is None:

361

stream = self._transport.get(self._name)

295

362

self._read_prefix(stream)

296

363

self._expected_elements = 3 + self._key_length

297

364

line_count = 0

315

382

node_value = value

316

383

self._nodes[key] = node_value

317

384

if self._key_length > 1:

318

subkey = list(reversed(key[:-1]))

385

# TODO: We may want to do this lazily, but if we are calling

386

# _buffer_all, we are likely to be doing

387

# iter_entries_prefix

319

388

key_dict = self._nodes_by_key

320

389

if self.node_ref_lists:

321

390

key_value = key, node_value[0], node_value[1]

322

391

else:

323

392

key_value = key, node_value

324

# possibly should do this on-demand, but it seems likely it is

325

# always wanted

326

393

# For a key of (foo, bar, baz) create

327

394

# _nodes_by_key[foo][bar][baz] = key_value

328

395

for subkey in key[:-1]:

464

531

keys supplied. No additional keys will be returned, and every

465

532

key supplied that is in the index will be returned.

466

533

"""

467

# PERFORMANCE TODO: parse and bisect all remaining data at some

468

# threshold of total-index processing/get calling layers that expect to

469

# read the entire index to use the iter_all_entries method instead.

470

534

keys = set(keys)

471

535

if not keys:

472

536

return []

473

537

if self._size is None and self._nodes is None:

474

538

self._buffer_all()

539

540

# We fit about 20 keys per minimum-read (4K), so if we are looking for

541

# more than 1/20th of the index its likely (assuming homogenous key

542

# spread) that we'll read the entire index. If we're going to do that,

543

# buffer the whole thing. A better analysis might take key spread into

544

# account - but B+Tree indices are better anyway.

545

# We could look at all data read, and use a threshold there, which will

546

# trigger on ancestry walks, but that is not yet fully mapped out.

547

if self._nodes is None and len(keys) * 20 > self.key_count():

548

self._buffer_all()

475

549

if self._nodes is not None:

476

550

return self._iter_entries_from_total_buffer(keys)

477

551

else:

619

693

if self._bisect_nodes is None:

620

694

readv_ranges.append(_HEADER_READV)

621

695

self._read_and_parse(readv_ranges)

696

result = []

697

if self._nodes is not None:

698

# _read_and_parse triggered a _buffer_all because we requested the

699

# whole data range

700

for location, key in location_keys:

701

if key not in self._nodes: # not present

702

result.append(((location, key), False))

703

elif self.node_ref_lists:

704

value, refs = self._nodes[key]

705

result.append(((location, key),

706

(self, key, value, refs)))

707

else:

708

result.append(((location, key),

709

(self, key, self._nodes[key])))

710

return result

622

711

# generate results:

623

712

# - figure out <, >, missing, present

624

713

# - result present references so we can return them.

625

result = []

626

714

# keys that we cannot answer until we resolve references

627

715

pending_references = []

628

716

pending_locations = set()

678

766

if length > 0:

679

767

readv_ranges.append((location, length))

680

768

self._read_and_parse(readv_ranges)

769

if self._nodes is not None:

770

# The _read_and_parse triggered a _buffer_all, grab the data and

771

# return it

772

for location, key in pending_references:

773

value, refs = self._nodes[key]

774

result.append(((location, key), (self, key, value, refs)))

775

return result

681

776

for location, key in pending_references:

682

777

# answer key references we had to look-up-late.

683

index = self._parsed_key_index(key)

684

778

value, refs = self._bisect_nodes[key]

685

779

result.append(((location, key), (self, key,

686

780

value, self._resolve_references(refs))))

830

924

trim_start = data.find('\n') + 1

831

925

else:

832

926

trim_start = data.find('\n', trim_start) + 1

833

assert trim_start != 0, 'no \n was present'

927

if not (trim_start != 0):

928

raise AssertionError('no \n was present')

834

929

# print 'removing start', offset, trim_start, repr(data[:trim_start])

835

930

if not end_adjacent:

836

931

# work around python bug in rfind

838

933

trim_end = data.rfind('\n') + 1

839

934

else:

840

935

trim_end = data.rfind('\n', None, trim_end) + 1

841

assert trim_end != 0, 'no \n was present'

936

if not (trim_end != 0):

937

raise AssertionError('no \n was present')

842

938

# print 'removing end', offset, trim_end, repr(data[trim_end:])

843

939

# adjust offset and data to the parseable data.

844

940

trimmed_data = data[trim_start:trim_end]

845

assert trimmed_data, 'read unneeded data [%d:%d] from [%d:%d]' % (

846

trim_start, trim_end, offset, offset + len(data))

941

if not (trimmed_data):

942

raise AssertionError('read unneeded data [%d:%d] from [%d:%d]'

943

% (trim_start, trim_end, offset, offset + len(data)))

847

944

if trim_start:

848

945

offset += trim_start

849

946

# print "parsing", repr(trimmed_data)

867

964

if line == '':

868

965

# must be at the end

869

966

if self._size:

870

assert self._size == pos + 1, "%s %s" % (self._size, pos)

967

if not (self._size == pos + 1):

968

raise AssertionError("%s %s" % (self._size, pos))

871

969

trailers += 1

872

970

continue

873

971

elements = line.split('\0')

874

972

if len(elements) != self._expected_elements:

875

973

raise errors.BadIndexData(self)

876

# keys are tuples

877

key = tuple(elements[:self._key_length])

974

# keys are tuples. Each element is a string that may occur many

975

# times, so we intern them to save space. AB, RC, 200807

976

key = tuple(intern(element) for element in elements[:self._key_length])

878

977

if first_key is None:

879

978

first_key = key

880

979

absent, references, value = elements[-3:]

951

1050

952

1051

:param readv_ranges: A prepared readv range list.

953

1052

"""

954

if readv_ranges:

955

readv_data = self._transport.readv(self._name, readv_ranges, True,

956

self._size)

957

# parse

958

for offset, data in readv_data:

959

if self._bisect_nodes is None:

960

# this must be the start

961

assert offset == 0

962

offset, data = self._parse_header_from_bytes(data)

963

# print readv_ranges, "[%d:%d]" % (offset, offset + len(data))

964

self._parse_region(offset, data)

1053

if not readv_ranges:

1054

return

1055

if self._nodes is None and self._bytes_read * 2 >= self._size:

1056

# We've already read more than 50% of the file and we are about to

1057

# request more data, just _buffer_all() and be done

1058

self._buffer_all()

1059

return

1060

1061

readv_data = self._transport.readv(self._name, readv_ranges, True,

1062

self._size)

1063

# parse

1064

for offset, data in readv_data:

1065

self._bytes_read += len(data)

1066

if offset == 0 and len(data) == self._size:

1067

# We read the whole range, most likely because the

1068

# Transport upcast our readv ranges into one long request

1069

# for enough total data to grab the whole index.

1070

self._buffer_all(StringIO(data))

1071

return

1072

if self._bisect_nodes is None:

1073

# this must be the start

1074

if not (offset == 0):

1075

raise AssertionError()

1076

offset, data = self._parse_header_from_bytes(data)

1077

# print readv_ranges, "[%d:%d]" % (offset, offset + len(data))

1078

self._parse_region(offset, data)

965

1079

966

1080

def _signature(self):

967

1081

"""The file signature for this index type."""

1218

1332

else:

1219

1333

yield self, key, node[2]

1220

1334

return

1335

nodes_by_key = self._get_nodes_by_key()

1221

1336

for key in keys:

1222

1337

# sanity check

1223

1338

if key[0] is None:

1225

1340

if len(key) != self._key_length:

1226

1341

raise errors.BadIndexKey(key)

1227

1342

# find what it refers to:

1228

key_dict = self._nodes_by_key

1343

key_dict = nodes_by_key

1229

1344

elements = list(key)

1230

1345

# find the subdict to return

1231

1346

try:

Older »