Сам термин масштабирование означает увеличение производительности при увеличении мощности железа

Ну тогда сортировка пузырьком тоже масштабируется...
Я вообще тогда не знаю - что
не масштабируется

Но
вы же пишете
если делать по уму, и синхронизировать только передачу данных между потоками, то приложение будет масштабироваться.
Где в этой цитате что-то про железо?
Эту цитату я и комментирую при условии, что железо не трогаем.
Масштабирование это когда одну задачу можно распараллелить на любое количество потоков или процессов. В этом случае производительность может увеличиться, а может и не увеличиться. Все зависит от задачи которую распараллелили, а так же от того - как распараллелили.
nginx запускает один мастер процесс и N рабочих процессов (параметр worker_processes в конфиге), каждый из которых мониторит события на своем наборе сокетов, подключения между рабочими процессами распределяются равномерно. Да, можно сделать 1 рабочий процесс и задействовать одно ядро, а можно выставить их по количеству ядер и задействовать CPU полностью, получив при этом почти линейное масштабирование по количеству ядер, что тут может быть не понятного?

Итак зафиксируем:
1. Один
поток процесс работает сразу с большим набором сокетов.
2. Можно сделать несколько
потоков процессов, которые никак друг с другом не взаимодействуют. Каждый
поток процесс работает независимо со своим набором сокетов.
ЗЫ: я тут на досуге документацию почитал, все таки я спрашивал про многопоточность в нгинкс, а вы переводите стрелки на процессы. Надеюсь вы в курсе, что потоки и процессы это разные вещи?
По умолчанию поддержка многопоточности выключенаОстался еще один шаг: что по вашему делает "мастер процесс"?
А еще можно использовать один файловый дескриптор epoll для всех подключений и опрашивать его из нескольких потоков, так получим более равномерное распределение нагрузки по потокам.
Можно... Если хотите чтобы все встало колом из-за ваших потоков и опросов

Хотелось бы увидеть на примере, как lock-free контейнеры приводят к однопоточному приложению, если они предназначены для доступа на чтение/запись из нескольких потоков

Хотите увидеть пример программиста, который решил сделать многопоточное приложение потому что так проще и якобы эффективнее, а в итоге сломал себе весь мозг костылями из нагромождений локфри структур и получил через год то же самое, что другой программист сделал в одном потоке за неделю?
К счастью у меня нет готового примера, хотя... Можно глянуть на разработчиков апача наверное.