mirror of https://gitee.com/bigwinds/arangodb
Replication manager + test fixes
This commit is contained in:
parent
ea58b36bd7
commit
93b31d6f42
|
@ -17,6 +17,7 @@ set(ROCKSDB_SOURCES
|
||||||
RocksDBEngine/RocksDBKeyBounds.cpp
|
RocksDBEngine/RocksDBKeyBounds.cpp
|
||||||
RocksDBEngine/RocksDBPrimaryIndex.cpp
|
RocksDBEngine/RocksDBPrimaryIndex.cpp
|
||||||
RocksDBEngine/RocksDBReplicationContext.cpp
|
RocksDBEngine/RocksDBReplicationContext.cpp
|
||||||
|
RocksDBEngine/RocksDBReplicationManager.cpp
|
||||||
RocksDBEngine/RocksDBRestExportHandler.cpp
|
RocksDBEngine/RocksDBRestExportHandler.cpp
|
||||||
RocksDBEngine/RocksDBRestHandlers.cpp
|
RocksDBEngine/RocksDBRestHandlers.cpp
|
||||||
RocksDBEngine/RocksDBRestWalHandler.cpp
|
RocksDBEngine/RocksDBRestWalHandler.cpp
|
||||||
|
|
|
@ -45,6 +45,10 @@ class RocksDBReplicationResult : public Result {
|
||||||
uint64_t _maxTick;
|
uint64_t _maxTick;
|
||||||
};
|
};
|
||||||
|
|
||||||
|
|
||||||
|
/// ttl in seconds
|
||||||
|
double RocksDBReplicationContextTTL = 30 * 60.0;
|
||||||
|
|
||||||
class RocksDBReplicationContext {
|
class RocksDBReplicationContext {
|
||||||
private:
|
private:
|
||||||
typedef std::function<void(DocumentIdentifierToken const& token)>
|
typedef std::function<void(DocumentIdentifierToken const& token)>
|
||||||
|
@ -70,6 +74,28 @@ class RocksDBReplicationContext {
|
||||||
RocksDBReplicationResult tail(TRI_vocbase_t* vocbase, uint64_t from,
|
RocksDBReplicationResult tail(TRI_vocbase_t* vocbase, uint64_t from,
|
||||||
size_t limit, VPackBuilder& builder);
|
size_t limit, VPackBuilder& builder);
|
||||||
|
|
||||||
|
double expires() const { return _expires; }
|
||||||
|
|
||||||
|
bool isDeleted() const { return _isDeleted; }
|
||||||
|
|
||||||
|
void deleted() { _isDeleted = true; }
|
||||||
|
|
||||||
|
bool isUsed() const { return _isUsed; }
|
||||||
|
|
||||||
|
void use() {
|
||||||
|
TRI_ASSERT(!_isDeleted);
|
||||||
|
TRI_ASSERT(!_isUsed);
|
||||||
|
|
||||||
|
_isUsed = true;
|
||||||
|
_expires = TRI_microtime() + RocksDBReplicationContextTTL;
|
||||||
|
}
|
||||||
|
|
||||||
|
/// remove use flag
|
||||||
|
void release() {
|
||||||
|
TRI_ASSERT(_isUsed);
|
||||||
|
_isUsed = false;
|
||||||
|
}
|
||||||
|
|
||||||
private:
|
private:
|
||||||
std::unique_ptr<transaction::Methods> createTransaction(
|
std::unique_ptr<transaction::Methods> createTransaction(
|
||||||
TRI_vocbase_t* vocbase);
|
TRI_vocbase_t* vocbase);
|
||||||
|
@ -87,6 +113,10 @@ class RocksDBReplicationContext {
|
||||||
LogicalCollection* _collection;
|
LogicalCollection* _collection;
|
||||||
std::unique_ptr<IndexIterator> _iter;
|
std::unique_ptr<IndexIterator> _iter;
|
||||||
ManagedDocumentResult _mdr;
|
ManagedDocumentResult _mdr;
|
||||||
|
|
||||||
|
double _expires;
|
||||||
|
bool _isDeleted;
|
||||||
|
bool _isUsed;
|
||||||
};
|
};
|
||||||
|
|
||||||
} // namespace arangodb
|
} // namespace arangodb
|
||||||
|
|
|
@ -0,0 +1,268 @@
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// DISCLAIMER
|
||||||
|
///
|
||||||
|
/// Copyright 2014-2016 ArangoDB GmbH, Cologne, Germany
|
||||||
|
/// Copyright 2004-2014 triAGENS GmbH, Cologne, Germany
|
||||||
|
///
|
||||||
|
/// Licensed under the Apache License, Version 2.0 (the "License");
|
||||||
|
/// you may not use this file except in compliance with the License.
|
||||||
|
/// You may obtain a copy of the License at
|
||||||
|
///
|
||||||
|
/// http://www.apache.org/licenses/LICENSE-2.0
|
||||||
|
///
|
||||||
|
/// Unless required by applicable law or agreed to in writing, software
|
||||||
|
/// distributed under the License is distributed on an "AS IS" BASIS,
|
||||||
|
/// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
||||||
|
/// See the License for the specific language governing permissions and
|
||||||
|
/// limitations under the License.
|
||||||
|
///
|
||||||
|
/// Copyright holder is ArangoDB GmbH, Cologne, Germany
|
||||||
|
///
|
||||||
|
/// @author Jan Steemann
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
#include "RocksDBReplicationManager.h"
|
||||||
|
#include "RocksDBEngine/RocksDBReplicationContext.h"
|
||||||
|
#include "Basics/MutexLocker.h"
|
||||||
|
#include "Logger/Logger.h"
|
||||||
|
|
||||||
|
#include <velocypack/Builder.h>
|
||||||
|
#include <velocypack/velocypack-aliases.h>
|
||||||
|
|
||||||
|
using namespace arangodb;
|
||||||
|
|
||||||
|
size_t const RocksDBReplicationManager::MaxCollectCount = 32;
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief create a cursor repository
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationManager::RocksDBReplicationManager()
|
||||||
|
: _lock(), _contexts() {
|
||||||
|
_contexts.reserve(64);
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief destroy a cursor repository
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationManager::~RocksDBReplicationManager() {
|
||||||
|
try {
|
||||||
|
garbageCollect(true);
|
||||||
|
} catch (...) {
|
||||||
|
}
|
||||||
|
|
||||||
|
// wait until all used cursors have vanished
|
||||||
|
int tries = 0;
|
||||||
|
|
||||||
|
while (true) {
|
||||||
|
if (!containsUsedCursor()) {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (tries == 0) {
|
||||||
|
LOG_TOPIC(INFO, arangodb::Logger::FIXME) << "waiting for used cursors to become unused";
|
||||||
|
} else if (tries == 120) {
|
||||||
|
LOG_TOPIC(WARN, arangodb::Logger::FIXME) << "giving up waiting for unused cursors";
|
||||||
|
}
|
||||||
|
|
||||||
|
usleep(500000);
|
||||||
|
++tries;
|
||||||
|
}
|
||||||
|
|
||||||
|
{
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
for (auto it : _contexts) {
|
||||||
|
delete it.second;
|
||||||
|
}
|
||||||
|
|
||||||
|
_contexts.clear();
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief stores a cursor in the registry
|
||||||
|
/// the repository will take ownership of the cursor
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationContext* RocksDBReplicationManager::addCursor(std::unique_ptr<RocksDBReplicationContext> cursor) {
|
||||||
|
TRI_ASSERT(cursor != nullptr);
|
||||||
|
TRI_ASSERT(cursor->isUsed());
|
||||||
|
|
||||||
|
RocksDBReplicationId const id = cursor->id();
|
||||||
|
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
_contexts.emplace(id, cursor.get());
|
||||||
|
|
||||||
|
return cursor.release();
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief remove a cursor by id
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool RocksDBReplicationManager::remove(RocksDBReplicationId id) {
|
||||||
|
RocksDBReplicationContext* cursor = nullptr;
|
||||||
|
|
||||||
|
{
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
auto it = _contexts.find(id);
|
||||||
|
if (it == _contexts.end()) {
|
||||||
|
// not found
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
|
||||||
|
cursor = (*it).second;
|
||||||
|
|
||||||
|
if (cursor->isDeleted()) {
|
||||||
|
// already deleted
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (cursor->isUsed()) {
|
||||||
|
// cursor is in use by someone else. now mark as deleted
|
||||||
|
//cursor->deleted();
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
|
||||||
|
// cursor not in use by someone else
|
||||||
|
_contexts.erase(it);
|
||||||
|
}
|
||||||
|
|
||||||
|
TRI_ASSERT(cursor != nullptr);
|
||||||
|
|
||||||
|
delete cursor;
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief find an existing cursor by id
|
||||||
|
/// if found, the cursor will be returned with the usage flag set to true.
|
||||||
|
/// it must be returned later using release()
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationContext* RocksDBReplicationManager::find(RocksDBReplicationId id, bool& busy) {
|
||||||
|
RocksDBReplicationContext* cursor = nullptr;
|
||||||
|
busy = false;
|
||||||
|
|
||||||
|
{
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
auto it = _contexts.find(id);
|
||||||
|
if (it == _contexts.end()) {
|
||||||
|
// not found
|
||||||
|
return nullptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
cursor = (*it).second;
|
||||||
|
|
||||||
|
if (cursor->isDeleted()) {
|
||||||
|
// already deleted
|
||||||
|
return nullptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (cursor->isUsed()) {
|
||||||
|
busy = true;
|
||||||
|
return nullptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
cursor->use();
|
||||||
|
}
|
||||||
|
|
||||||
|
return cursor;
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief return a cursor
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
void RocksDBReplicationManager::release(RocksDBReplicationContext* cursor) {
|
||||||
|
{
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
TRI_ASSERT(cursor->isUsed());
|
||||||
|
cursor->release();
|
||||||
|
|
||||||
|
if (!cursor->isDeleted()) {
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
|
||||||
|
// remove from the list
|
||||||
|
_contexts.erase(cursor->id());
|
||||||
|
}
|
||||||
|
|
||||||
|
// and free the cursor
|
||||||
|
delete cursor;
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief whether or not the repository contains a used cursor
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool RocksDBReplicationManager::containsUsedCursor() {
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
for (auto it : _contexts) {
|
||||||
|
if (it.second->isUsed()) {
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief run a garbage collection on the cursors
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool RocksDBReplicationManager::garbageCollect(bool force) {
|
||||||
|
auto const now = TRI_microtime();
|
||||||
|
std::vector<RocksDBReplicationContext*> found;
|
||||||
|
|
||||||
|
try {
|
||||||
|
found.reserve(MaxCollectCount);
|
||||||
|
|
||||||
|
MUTEX_LOCKER(mutexLocker, _lock);
|
||||||
|
|
||||||
|
for (auto it = _contexts.begin(); it != _contexts.end(); /* no hoisting */) {
|
||||||
|
auto cursor = (*it).second;
|
||||||
|
|
||||||
|
if (cursor->isUsed()) {
|
||||||
|
// must not destroy used cursors
|
||||||
|
++it;
|
||||||
|
continue;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (force || cursor->expires() < now) {
|
||||||
|
cursor->deleted();
|
||||||
|
}
|
||||||
|
|
||||||
|
if (cursor->isDeleted()) {
|
||||||
|
try {
|
||||||
|
found.emplace_back(cursor);
|
||||||
|
it = _contexts.erase(it);
|
||||||
|
} catch (...) {
|
||||||
|
// stop iteration
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (!force && found.size() >= MaxCollectCount) {
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
++it;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
} catch (...) {
|
||||||
|
// go on and remove whatever we found so far
|
||||||
|
}
|
||||||
|
|
||||||
|
// remove cursors outside the lock
|
||||||
|
for (auto it : found) {
|
||||||
|
delete it;
|
||||||
|
}
|
||||||
|
|
||||||
|
return (!found.empty());
|
||||||
|
}
|
|
@ -0,0 +1,112 @@
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// DISCLAIMER
|
||||||
|
///
|
||||||
|
/// Copyright 2017 ArangoDB GmbH, Cologne, Germany
|
||||||
|
///
|
||||||
|
/// Licensed under the Apache License, Version 2.0 (the "License");
|
||||||
|
/// you may not use this file except in compliance with the License.
|
||||||
|
/// You may obtain a copy of the License at
|
||||||
|
///
|
||||||
|
/// http://www.apache.org/licenses/LICENSE-2.0
|
||||||
|
///
|
||||||
|
/// Unless required by applicable law or agreed to in writing, software
|
||||||
|
/// distributed under the License is distributed on an "AS IS" BASIS,
|
||||||
|
/// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
||||||
|
/// See the License for the specific language governing permissions and
|
||||||
|
/// limitations under the License.
|
||||||
|
///
|
||||||
|
/// Copyright holder is ArangoDB GmbH, Cologne, Germany
|
||||||
|
///
|
||||||
|
/// @author Simon Grätzer
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
#ifndef ARANGO_ROCKSDB_ROCKSDB_REPLICATION_MANAGER_H
|
||||||
|
#define ARANGO_ROCKSDB_ROCKSDB_REPLICATION_MANAGER_H 1
|
||||||
|
|
||||||
|
#include "Basics/Common.h"
|
||||||
|
#include "Basics/Mutex.h"
|
||||||
|
|
||||||
|
struct TRI_vocbase_t;
|
||||||
|
|
||||||
|
namespace arangodb {
|
||||||
|
|
||||||
|
class RocksDBReplicationContext;
|
||||||
|
typedef uint64_t RocksDBReplicationId;
|
||||||
|
|
||||||
|
class RocksDBReplicationManager {
|
||||||
|
public:
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief create a cursors repository
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
explicit RocksDBReplicationManager();
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief destroy a cursors repository
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
~RocksDBReplicationManager();
|
||||||
|
|
||||||
|
public:
|
||||||
|
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief stores a cursor in the registry
|
||||||
|
/// the repository will take ownership of the cursor
|
||||||
|
////////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationContext* addCursor(std::unique_ptr<RocksDBReplicationContext> cursor);
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief remove a cursor by id
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool remove(RocksDBReplicationId);
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief find an existing cursor by id
|
||||||
|
/// if found, the cursor will be returned with the usage flag set to true.
|
||||||
|
/// it must be returned later using release()
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
RocksDBReplicationContext* find(RocksDBReplicationId, bool&);
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief return a cursor
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
void release(RocksDBReplicationContext*);
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief whether or not the repository contains a used cursor
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool containsUsedCursor();
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief run a garbage collection on the cursors
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
bool garbageCollect(bool);
|
||||||
|
|
||||||
|
private:
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief mutex for the cursors repository
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
Mutex _lock;
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief list of current cursors
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
std::unordered_map<RocksDBReplicationId, RocksDBReplicationContext*> _contexts;
|
||||||
|
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
/// @brief maximum number of cursors to garbage-collect in one go
|
||||||
|
//////////////////////////////////////////////////////////////////////////////
|
||||||
|
|
||||||
|
static size_t const MaxCollectCount;
|
||||||
|
};
|
||||||
|
}
|
||||||
|
|
||||||
|
#endif
|
|
@ -840,6 +840,12 @@ bool RocksDBVPackIndex::supportsFilterCondition(
|
||||||
return matcher.matchAll(this, node, reference, itemsInIndex, estimatedItems,
|
return matcher.matchAll(this, node, reference, itemsInIndex, estimatedItems,
|
||||||
estimatedCost);
|
estimatedCost);
|
||||||
}*/
|
}*/
|
||||||
|
// mmfiles failure point compat
|
||||||
|
if (this->type() == Index::TRI_IDX_TYPE_HASH_INDEX) {
|
||||||
|
TRI_IF_FAILURE("SimpleAttributeMatcher::accessFitsIndex") {
|
||||||
|
THROW_ARANGO_EXCEPTION(TRI_ERROR_DEBUG);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
std::unordered_map<size_t, std::vector<arangodb::aql::AstNode const*>> found;
|
std::unordered_map<size_t, std::vector<arangodb::aql::AstNode const*>> found;
|
||||||
std::unordered_set<std::string> nonNullAttributes;
|
std::unordered_set<std::string> nonNullAttributes;
|
||||||
|
@ -1210,6 +1216,15 @@ arangodb::aql::AstNode* RocksDBVPackIndex::specializeCondition(
|
||||||
SimpleAttributeEqualityMatcher matcher(_fields);
|
SimpleAttributeEqualityMatcher matcher(_fields);
|
||||||
return matcher.specializeAll(this, node, reference);
|
return matcher.specializeAll(this, node, reference);
|
||||||
}*/
|
}*/
|
||||||
|
// mmfiles failure compat
|
||||||
|
if (this->type() == Index::TRI_IDX_TYPE_HASH_INDEX) {
|
||||||
|
TRI_IF_FAILURE("SimpleAttributeMatcher::specializeAllChildrenEQ") {
|
||||||
|
THROW_ARANGO_EXCEPTION(TRI_ERROR_DEBUG);
|
||||||
|
}
|
||||||
|
TRI_IF_FAILURE("SimpleAttributeMatcher::specializeAllChildrenIN") {
|
||||||
|
THROW_ARANGO_EXCEPTION(TRI_ERROR_DEBUG);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
std::unordered_map<size_t, std::vector<arangodb::aql::AstNode const*>> found;
|
std::unordered_map<size_t, std::vector<arangodb::aql::AstNode const*>> found;
|
||||||
std::unordered_set<std::string> nonNullAttributes;
|
std::unordered_set<std::string> nonNullAttributes;
|
||||||
|
|
Loading…
Reference in New Issue