Насчет графиков, не помешало бы распределение по возрастам.
Для справки:
при работе над первичной выборкой по распределения по возрастам был получен следующий результат
+-------+----------+
| age | COUNT(*) |
+-------+----------+
| < 30 | 20103 |
| < 120 | 40627 |
| 120+ | 153717 |
+-------+----------+
3 rows in set (6.93 sec)
Выборка сдела без учёта обработки блоков орфанов, которые однозначно повлияют на результат в сторону некоторого увеличения, но, по нашему мнению, как процентное отношение, так и сумма выходов особо не изменится. Этот вопрос больше на уровне точности, а не статистической выборки.
Остаётся пока открытым 2 вопроса:
1. достаточно ли этих диапазонов выборки;
2. есть ли необходимость выбирать статистику для каждого блока.
Насчет графиков, не помешало бы распределение по возрастам.
и по мелочности.
На эту тему общей позиции по необходимости данной выборки выработано не было.
Фактически обсуждение было завершено на том, что для данной выборки необходимо формировать двумерный массив с учётом предыдущего запроса, что достаточно сильно нагрузит БД.
И тут же встаёт вопрос об актуальных диапазонах размерной выборки.
P.S. Небольшое уточнение для опережения отдельных уточняющих вопросов: выборка производится по выходам в транзакциях.