0.0
No commit activity in last 3 years
No release in over 3 years
PostgreSQL fast cache. Faster than memcache+dalli on same machine. Features: 'instant' reordering cached collection and subcollection rendering, prerendering, 2-3 faster rendering of partially cached collection
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
 Dependencies
 Project Readme

ATTENTION

To use this gem you need PostgreSQL 9.4 and higher!

ATTENTION(РУС)

Для корректной работы библиотеки требуется версия PostgreSQL не ниже 9.4!

NitroPgCache

This gem create DB-based solution for caching relation collections. It based on PostgreSQL version >= 9.4 . It faster than memcache+dalli combination. In some cases three times faster, but with all DB facilities!

Right now nitro_pg_cache is in alpha-release state. It's working, but may need additional tuning and features, for example limits and expiring, actually I don't know which will suit best.

FEATURES

Already working*: (* all benchmark numbers are given with pg_cache_key gem enabled, this mean that in rails < 5 or without pg_cache_key, you'll get +25% additional speed bonus for cached collection )

  1. First rendering is faster then memcache+dalli on same machine. ~10% faster

  2. Reordering and sub-collection rendering on cached collection are 3 times faster then memcached+dalli** Rendering are done with DB speed i.e. You can assume that feed rendering speed now are some very small time constant. 100 and 1K records are rendering with ~0.01s difference ( partially rendered subcollection is a superposition of 1.15 and 3 times, depends of non-cached elems amount ) ** it's assymptotic value, when collection rendering takes much more time than other rendering parts, when collection is small and collection rendering is comparable to other page parts rendering you'll get less than 3

  3. You can enable prerendering for any scope of your DB records ( if you has a reasonable amount of different keys|locals sets per db record )

  4. Agile managing of your cache because it's in DB now, you for example don't need to touch elems to remove their cache you can do: NitroCache.where(nitro_cacheable: collection).delete_all

  5. In 4.x rails if you don't use pg_cache_key, but use nitro_cache then you get additional +25% speedup for completly cached feed

Can be done soon

  1. Easily can switch back and forth from usual cache to db cache using cache_by key.
  2. Shards DB
  3. auto-renewable cache. we can save locals to jsonb column, after touching cached-element we can rerender all dependent caches with saved locals. Differs from prerender that we don't prerender all possibilities, but only already rendered ( must check how mass update will suffer from json insert ).
  4. Expiring and quantity limits, cache expiring can be done on different conditions including last time viewed.

NitroPgCache (РУС)

Данная библиотека реализует кеширование relation-коллекций на основе движка PostgreSQL последних версий (>=9.4). Получившийся результат по всем показателям скороси не уступает классической схеме memcache+dalli, а во многих случаях и превосходит ее в разы, обладая при этом всеми достоинствами базы данных.

В настоящий момент библиотека находится в состоянии alpha-release. Основной функционал ее работает, но ряд дополнительных возможностей требует реализации. Например ограничения на количество кешей, устаревание кешей и пр. . Если есть какие-то пожелания какие конкретно должны быть возможности связанные с этим: велкам

ВОЗМОЖНОСТИ БИБЛИОТЕКИ

Реализованные возможности*: (* величины указаны при использовании гема pg_cache_key для реализации cache_key у коллекций, поэтому в 4-х рельсах nitro_cache получает еще +25% выигрыша по времени, если pg_cache_key не исопльзуется, даже на полностью кешированной коллекции, см 6) )

  1. Первичный рендеринг быстрее чем у memcache+dalli на ~10% для коллекции ( Это малоактуально если рендеринг коллекции занимает менее 50% от рендеринга всей страницы, т.е. выигрыш на всей странице становится ~ 5% )
  2. Пересортировка или рендеринг подколлекций на закешированной матрешкой коллекции в 2-3 и более раз быстрее ( чем больше коллекция тем больше выигрыш )
  3. Возможность пререндеринга для элементов, т.е. при обновлении кешируемого элемента его кеши обновляются автоматом + спец рейк на их первичную генерацию 3.a Возможность пререндеринга только для определенного scope элементов.
  4. Управление кешем на уровне БД. Например сброс кешей можно делать без того чтобы трогать объекты: NitroCache.where(nitro_cacheable: collection).delete_all и пр.
  5. В четвертых рельсах, если не использовать gem pg_cache_key дополнительно выигрывает 25% времени от memcached+dalli

Нереализованные пока

  1. Можно легко переключать между обычным кешем и бд кешем. используя cache_by ?
  2. БД Шардинг
  3. Авторекеш. Возможно в дальнейшем автоматичечки перекешировывать существующие кеши без использования prerender - true, а с сохранением к каждому ключу еще и Json для локалс.
  4. Устаревание И лимитирование кешей. Может быть реализовано многими способами.

RESTRICTIONS:

Only clear collections rendering can be cached with this gem. i.e.: Can convert:

    -cache [@records, locals ] do
      =render partial: 'record', collection: @records, locals: locals

Can't convert ( you will need to split it )

    -cache [@records, locals ] do
      =render partial: 'record', collection: @records, locals: locals
      =render partial: 'pagination_footer', records: @records

ОГРАНИЧЕНИЯ:

Только чистый кеш на коллекцию может использоваться с данной библиотекой: Может быть сконвертированно:

    -cache [@records, locals] do
      =render partial: 'record', collection: @records, locals: locals

Не получится сконвертировать без изменений ( придется разделить коллекцию и футер)

    -cache [@records, locals ] do
      =render partial: 'record', collection: @records, locals: locals
      =render partial: 'pagination_footer', records: @records

CACHING ALGORITHMS ( STRAIGHT/REVERSE/ARRAY CACHING )

Three types of caching collection mechanism are used: straight, 'reverse', array-elem straight and reverse used for relation objects! array-elem - instantinated array or elem

straight (db_cache_collection_s) - similar to usual cache, we check does every elements already cached, if so we just return aggregation result, if not - we just add +1 join on nitro_caches +1 select for nitro_cached_value as virtual attribute, then we render element if nitro_cached_value.nil? or use nitro_cached_value otherwise.

'reverse' (db_cache_collection_r) - is not similar to usual cache algorithms it used 'reversed' logic: we create special SQL-query only for non-cached elements, render them, and then we use aggregation on a previously given collection. This special SQL-query use all includes, joins, select which was in original query so we successfully escaping N+1 problems same way as usual cache did. This approach gives us more speed even on whole noncached collection. How it possible? Less string concatenation, less reallocation e.t.c

array-elem (db_cache_array) - this is method used only with prerender: true for changed record. DON'T USE IT ELSEWHERE!! If you have complex hierarchy of models and don't include them on update action of your controller it may give you N+1 problem internally.

ВАРИАНТЫ КЕШИРОВАНИЯ ( STRAIGHT/REVERSE/ARRAY CACHING )

Прямой и реверсивный ( straight and reverse ) используются только для relation объектов. array cache используется только если prerender: true для измененного элемента.

Прямое кеширование (db_cache_collection_s): мы классическим образом сначала проверяем что вся коллекция закеширована. Если закеширована - запросом с исолпьзованием str_agg собираем фид коллекции на уровне БД. нет - идем последовательно и рендерим, если нет кеша, или подставляем кеш, если он есть.

Реверс кеширование (db_cache_collection_r): Мы делаем дополнительный специальный SQL-запрос, с учетом тех настроек инклюдов джойнов и селектов которые есть в полученном relation, но с условием что выбираются только элементы по которым нет кеша. прогоняем по ним рендеринг коллекции. и после этого проводим запрос на аггрегацию фида. Данный вариант кеширования оказался быстрее как прямого кеширования, так и обычной связки memcache + dali ( я думаю из-за того что меньше работы со строками ).

array-elem (db_cache_array) - Этот метод используется только для prerender=true, только для тех элементов которые изменились. НЕ ИСПОЛЬЗУЙТЕ ЕГО НИГДЕ В ДРУГИХ СЛУЧАЯХ!

BENCHMARK VS MEMCACHE + DALLI

Comparisons were made manually with rack mini-profiler gem + I used htop system-monitor to be sure that nothing going in the background and tempering with results

CONFIGURATION: dalli + memcached same machine vs postgres 9.4 same machine VM config: 8 logical cores, Core i7 SSD 10Gb RAM

                                     ATTENTION NOTICE:   

This numbers just a VERY particular case, you can use them to predict your own comparative numbers very carefully, and of course you can't predict your own time in seconds! But I did it on two completly different tables and their collections and get very closed result in percents meaning that numbers are quite representative

first column - records count rv - "reverse" cache when we first just render only missing elements and save them to DB, and second aggregate all collection from db dbs - data base straight mean it's render's with one straightforward iteration mmch - usual matroska doll cache with memcached and dalli

FIRST RENDER

Records count 'Reverse' nitro cache Straight nitro cache Memcache Ratio
1K 14.7s 16s 17s ~1.15 faster
0.38K 4.9s 5.2s 5.6s
0.1K 1.3s 1.4s 1.5s ~1.15 faster

FIRST RENDER SUBCOLLECTION/REORDERING (i.e. when all elements are cached, but not whole collection)

Records count 'Reverse' nitro cache Memcache Ratio
1K 0.5s 1.5s ~3 times faster
0.38K 0.35+s 0.75+ ~2 times faster
0.12K 0.2-0.25 0.4-0.5+s ~2 times faster

PARTIAL COLLECTION RENDERING

We can assume this is superposition of already obtained numbers. i.e inside range: 1.15-3 ( the right borders number depends on the collection size, the bigger collection bigger the number )

GETTING COLLECTION CACHE ( whole collection cached ( nitro wins cause it's not need to instantinate collection ) )

!Notice: Next comparision is valid only for rails <=4.2 without pg_cache_key gem! In rails >= 5 or with pg_cache_key gem it will bring nearly same result i.e. ratio will be 1!

Records count 'Reverse' nitro cache Memcache Ratio
1K 0.5s 1s ~2 times faster
0.38K 0.35+s 0.6 ~1.7 times faster
0.12K 0.2-0.25 0.38s ~1.7 times faster

СРАВНЕНИЕ С MEMCACHE + DALLI

Сравнения провел вручную на живых страницах с исопльзованием rack mini-profiler gem. Используя htop, следил, чтобы ничего не загружало систему дополнительно и портило результаты.

Настройки виртуалки: dalli + memcached vs postgres 9.4 ( ~ 8 логических ядер + 10Gb, реальная машина Core i7 SSD 16Gb RAM)

                                    ВНИМАНИЕ:   

Полученные результаты это конкретный случай, их нельзя использовать для того чтобы предстказать ваш результат в секундах, НО с определенной осторожностью можно предсказать относительные значения. Я прогонял тест на двух совершенно разных таблицах/коллекциях и сравнительные значения были примерно одинаковые.

Расшифровка таблицы: first column - Количество записей из таблицы rv - (reverse) время потраченное при реверсивном кешировании/рендеринге dbs - (data base straight) кеширование/рендеринг осуществляется в один прямой проход mmch - (memcache) обычный матрешный кеш memcached + dalli

Первичный рендеринг

Records count 'Reverse' nitro cache Straight nitro cache Memcache Ratio
1K 14.7s 16s 17s ~1.15 faster
0.38K 4.9s 5.2s 5.6s
0.1K 1.3s 1.4s 1.5s ~1.15 faster

Первичный рендеринг на подколлекцию или со сменой порядка (т.е. все отдельные элементы уже закешированы, но не вся коллекция)

Records count 'Reverse' nitro cache Memcache Ratio
1K 0.5s 1.5s ~3 times faster
0.38K 0.35+s 0.75+ ~2 times faster
0.12K 0.2-0.25 0.4-0.5+s ~2 times faster

Частично закешированая коллекция

Можно точно предположить что время/быстродействие будет суперпозицией от первых двух результатов и будет лежать в пределах 1.15-3

Получение полного кеша коллекции ( только для рельс < 5 )

Обращаю внимание что в связи с отличием в получение cache_key на коллекции между rails 4.2 и rails 5 Данные цифры актуальны только для старых версий рельс без использования моего гема pg_cache_key В противному случае результаты будут примерно одинаковые!!

Records count 'Reverse' nitro cache Memcache Ratio
1K 0.5s 1s ~2 times faster
0.38K 0.35+s 0.6 ~1.7 times faster
0.12K 0.2-0.25 0.38s ~1.7 times faster

MEMORY USAGE

I didn't make a special comparision, but I assume that there is a insufficient difference between usual cache and pg_cache.

ИСПОЛЬЗОВАНИЕ ПАМЯТИ

Объем используемой памяти примерно одинаковый и может зависеть от того какой конкретно пришел запрос, сколько в нем уже закешированных элементов сколько новых и пр.

GENERAL FALLBACK

With any variant of prerender true/false all not found caches get themselves cached usual way as in prerender-false case. i.e. as usual cache will do.

ОСНОВНОЕ ПОВЕДЕНИЕ ПО УМОЛЧАНИЮ

Независимо от того стоит prerender-true или нет, если на момент запроса значение nitro_cache_value пустое, то кеширование запускается обычным ходом, который совпадает, с вариантом когда prerender-false.

HOW IT BEHAVE WHEN SOMETHING CHANGES ( KEYS, PARTIALS, ETC )

The main rule of thumb: no prerendering at server start, only mass cleaning old and creating new nitro_partial records! If you are using prerender, then run rake task prerender in parallel manually or by any automation script The rules of cache changes are depended on prerender state of partial true|false

Object changes:

  1. prerender-true => after_commit -> render all locals variants
  2. prerender-false => after_commit -> clear all caches

Cache params changes:

  1. New keys added. prerender true => rails started as usual, you run prerender rake manually!!, prerender false => do nothing! Everything will be rendered on demand!

  2. Keys were removed => nitro_partial.db_cached_partials.where.not( nitro_partial.cache_keys.keys ).delete_all at rails start.

  3. New partial

  • the new nitro_partial record would be added to DB at rails start if we use prerender or at first render otherwise all prerendering only in rake!
  1. Partial changed.
  • remove all obsolete keys from DB at rails start
  1. Removing partial. all obsolete cache keys will be deleted at application start
  2. Prerender -> toggle
    • true -> false => do_nothing
    • false -> true => manually run rake :nitro_prerender to prerender those who don't exists.
  3. partial naming changes.
    • it's possible to create rake rename_nitro_partial but right now you just rename your partial - loose all rendered cache pieces and rerender them as if you create new one. Also it's possible to change cache key mechanism generation and use not the file name, but file content hash_key, then any renaming and moving of a file will not affect any cached values. Now it's not the point.
  4. When expiration params changes При изменении параметров устаревания, проверяем в rake :expire_db_nitro_cache который можно в кронджобы вписать. все кеши на соответствие новым правилам. Ненужное удаляем.

ПРАВИЛА ИЗМНЕНИЯ КЕША, ЕСЛИ ЧТО_ТО ПОМЕНЯЛОСЬ (РУС)

Главное правило: никакого пререндеринга на старте сервера иначе у деплоя развяжется пупок. На старте только: массовое удаление устаревшего, создание новых записей nitro_partial для новых паршиалов. Правила поведения кеша при изменениях ( поведение зависит от значения prerender - true|false) При изменении объекта:

  1. prerender-true => after_commit -> render all variants
  2. prerender-false => after_commit -> clear, view on demand -> render and mass save

При изменении параметров кеша:

  1. Добавились новые ключи. true => рельсы стартуют без дополнительного пререндеринга, параллельно запускаем rake :nitro_prerender, false => do nothing! Ключей не было, значений не было, все будет генериться по первому требованию
  2. Удалились ключи true/false => nitro_partial.db_cached_partials.where.not( nitro_partial.keys ).delete_all на старте приложения можно. + Если уже сгенеренные значения не важны то можно просто переписать код, кеши для не найденных файлов будут удалены, новые можно прерндернуть соответствующим рейком
  3. При изменении параметров устаревания, проверяем в rake :expire_db_nitro_cache который можно в кронджобы вписать. все кеши на соответствие новым правилам. Ненужное удаляем.

PARTIAL PRERENDER

Since nitro_pg_cache works as usual cache* also we can prerender only for part of keys and part of records, only most wanted.

For example I have feed different for admin and user, but since admin can wait more and also looks at the feed not very often. So I can set for prerender locals: { role: [User] }, instead of locals: { role: [User, Admin] } and get twice less prerendered caches.

Another example: we have a long history of payments but actual need is only for a last year for example, so we can set prerender scope with condition on :created_at column, and prerender only a last year records.

*see section LIMITATIONS for more details on the possibilities of replacing usual feed cache with nitro

ЧАСТИЧНЫЙ ПРЕРЕНДЕРИНГ

В силу того что nitro_cache может работать практически как обычный матрешный кеш* мы можем включить пререндеринг только для части ключей и части записей.

Например у меня разное отображение ленты для админа и для пользователя. Админ пользуется лентой нечасто и в целом может подождать на полсекунды дольше. ТО в параметрах пререндеринга можно написать locals: { role: [User] }, вместо locals: { role: [User, Admin] } и пререндрить вполовину меньше вариантов для записи.

Второй пример: мы ведем длинную историю оплат пользователей, но для работы бухов нужен последний квартал или там год мы можем выставить scope для пререндеринга по :created_at и пререрндерить только нужные записи.

EXPIRING

NitroCache table contains only actual not-expired caches. Any touch of nitro_cacheable record will destroy all it nitro_caches (and prerender thoose with prerender-true option), so that is how expiration maintained.

Keeping NitroCache table small and user actual

Right now all cache get timestamp for the last access ( :viewed_at ) so it possible to control table size on time basis. I.e. you can remove those caches that lost their actuality to users and have been out of users attention for a long period.

СБРОС НЕ ИСПОЛЬЗУЕМЫХ КЕШЕЙ

Сейчас все ключи хранят штамп времени последнего просмотра поэтому можно легко реализовать устаревающий кеш. например как рейк + крон-джоб

STRAIGHT VS REVERSE VS CLASSIC POSSIBLE PROBLEMS

  1. DB Sharding for reverse-cache. If we use db sharding reverse-cache may need additional tuning and testing since it's doing its job in two steps. Straight-cache will work anyway.
  2. Exotic cases for any variant of pg_cache. If we render same collection twice with different partial inside one controller action ( it's quite unusual behaviour ), than we may instatinate collection twice.

STRAIGHT VS REVERSE VS CLASSIC ВЕРОЯТНЫЕ ПРОБЛЕМЫ

  1. БД-шардинг при обратном кешировании. Если мы используем БД шардинг, то вариант реверс кеширования требует доработки, потому что мы должны спрашивать аггрегацию сразу же после того как сделали апдейт, поэтому по идее это должно идти на мастер-шард.

  2. Экзотические варинты многоразового рендеринга с разными паршиалами одной коллекции в одном методе контроллера. Тогда может быть многоразовая инстантинация на первом рендеринге.

                             NitroPartial STRUCTURE AND SPECS
    
  3. В БД паршиалы уникальны по относительным путям

  4. Параметры специфические для паршиала ( сколько хранить записей и когда экспайрить, можно задавать прямо в рендер )

  5. При загрузке мы все паршиалы из БД всасываем в хеш partials_cache = { path: Partial }, проверяем наличие файлов, если какого-то нет - вычищаем БД от его записей.

  6. Проверяем что хеши на контент файлов не поменялись, для всех которые поменялись - удаляем кеш-записи

  7. При запросе объекта Partial по путю из partials_cache в случае отсутствия оного - он сначала заправшивается в БД ( это случай когда он параллельно был создан в соседнем процессе ) и если такого нет создается новый.

Usage

As cache replacement

Replace:

 -cache [@requests] do
   =render partial: "admins/requests/request", collection: @requests, cached: true

with:

 =db_cache_collection( collection: @requests, partial: "admins/requests/request.html.slim", as: :request, locals: {} )

inside request.html.slim replace:

 -cache[request] do

with:

 -db_cache(request) do

and inside your model:

class Request < ActiveRecord::Base
 acts_as_nitro_cacheable    
end

Prerender

If you want to use prerender model will look like:

class Request < ActiveRecord::Base
 acts_as_nitro_cacheable    
 add_prerender_partial( partial: "admins/requests/request.html.slim",
                      all_locals: {},
                      as: :request,
                      scope: Request.except_created.with_deleted.where(created_at: -6.month.from_now..Time.now ) )
end

# prerender all scopes
Partial.all.each(&:update_caches)

Installation

Add this line to your application's Gemfile:

gem 'nitro_pg_cache'

And then execute:

$ bundle install

Or install it yourself as:

$ gem install nitro_pg_cache
$ rake nitro_pg_cache:install:migrations
$ rake db:migrate

Contributing

Issues and PR are welcome.

TODO

  1. Нужно config в рельсах приделать. по аналогии с конфигом для дали например.

  2. выписать какие из вариантов для пререндеринга не прошли пользовательского тестирования, проверить работу с комбинациями ключей

  3. Обновление прогресса для rake db_cache по количеству записей, а не по уникальным ключам шаги. Вариант: вынести получение незакешированной части коллекции в отдельный метод, получить общее количество незакешированных элементов, переопределить рядом в рейке db_cache с вызовом inc на прогресс внутри.

  4. устаревание expires?

  5. Общие лимиты. можно устанавливать через конфиг на всех и на отдельные паршиалы следить за переполнением можно в кронджобах

  6. rspec (!!) Для целей тестирования достаточно переопределить ф-ию аггрегации и можно тестировать на sqlite :memory, т.е. в принципе замокать ее в спеках, остальное должно работать везде. + замокать cashe_keys возможно придется также ( если не сработает: https://sqlite.org/json1.html )

Possibilities for the future

Возможные направления для дальнейшей оптимизации рендеринга коллекций:

  1. паралельный рендеринг коллекции неоткешированных элементов, в силу того что нам не надо морочить голову с очерендностью рендеринга, можно параллельно отрендерить N подколлекций и бабахнуть это на БД одним запросом, скорее всего GIL не должен мешать потому что они не пересекаются и пр.

Актуально если мы не можем использовать prerender ( например у нас комбинаций ключей получается оч много ) НО почти неактуально, если мы используем пререндер.

Также возможно: автоматическое получение параметров с которых начинает иметь смысл параллелить

  1. Еще одна возможность разгона рельсового приложения с получением коллекций: nginx-sql модуль. Имеет смыссл если коллекция будет получаться отдельным запросом.

  2. Настраиваемый размер коллекции при которой происходит переключение между дополнительным кешированием всей коллекции или же остаемся в рамках запроса на склейку строк. Сейчас сделан выбор в пользу оптимизации больших коллекций т.е. делается еще дополнительные запросы в БД, что дает нам еще большую скорость на уже закешированных больших коллекциях, но на маленьких будет наверняка дороже чем сразу склеить результат.

License

The gem is available as open source under the terms of the MIT License.