Ребята из Амазон недавно выпустили сервер на ARM у них это 2 попытка. Какая это попытка по миру не скажу.
Так вот ихней ARM обогнал x86 по производительности.
https://habr.com/ru/company/dcmiran/blog/479074/
Секрет в том что они использовали более быструю память и плюс размере кэша как у x86. Так как техпроцесс у них опережает интеловский локально получили выигрыш.
Сравнивать x86 и ARM задачка не простая.
Это в плоть до конца 80 ISA определяла первенство. А после появления больших микросхем позволило организовать кэш-микрокоманд. И теперь уже определяет не ISA и микро-архитектура. Так как 90% времени съедает обращение к памяти, то у кого кэш больше тот и выигрывает. Эти чип-мейкеры идиоты полнейшие. Им в книжках теорию расписали ещё в 20-ных если не раньше. А они ARM сделали производительный только вчера.
Сильная сторона i386 вернее 8086 процессора это индексное обращение к памяти. Т.е работа со структурами, массивами и объектами. У ARM в этом плане по хуже так как загрузка индекса это плюс 1 так по сравнению с 8086. В принципе в ARM это можно решить, но пока технологию 0 latence придерживают.
Так же сильной стороной 8086 являеются строковые команды rep movs и rep cmps. Да конечно одно время эти команды проигрывали MOVNTDQ и даже MOVD.
Но не суть, суть в том что строки UTF-8 легко сравнивать этими командами и передавать из переменной в переменную. А на уровнее микроахитектуры можно ускорять в разы.
Одна только оптимизация строк Borland'у позволила ускорить свои приложения в 2 раза! и обойти ближайших конкурентов.
У ARM для этого ничего такого нету. Единственное это SIMD для пересылки большого набора данных. За счёт SIMD пересылка строк будет одинаковой. Что мы и видим в тесте кэширования веб-запросов.
Что касается домашнего применения ARM то тут нужны быстрые парсеры. ARM пытается выиграть за счёт оптимизации ветвлений x:=5=6 ? 5:4;
Когда как в x86 это решают за счёт SIMD обработки. У ARM с SIMD в этом плане тоже всё нормально, Для быстрых паресров нужна технология внедрения битов. Сурагатовые пары UTF как раз облегчают такую работу, но тут вопрос к программистам которые не умеют непосредственно работать с UTF8, а в начале декодируют его UCS16 или подобные кодировки. За счёт комбинации SIMD с маской ARM может выигрывать в парсинге данных.
Что касается графики то AlphaBlit это основная операция и тут выигрывает тот у кого регистры больше. У Intel проблемы с AVX512 у ARM такой проблемы нету у них 128 битные регистры. Зато ARM может с маской оптимизироваться. Так что тут ARM проигрывает, но за счёт оптимизированного софта незначительно.
Плюс FPU у ARM упрощённый, это значит что в научных расчётах он будет по быстрее чем x86, но вот в рендеринге напротив будет проигрывать.
Но на текущий момент у ARM нету оптимизированного FPU для производительных вычислений.
В целом обе архитектуры идут на ровне. В перспективе ARM даже будет по быстрее. Но сейчас у ARM нету процессора который бы смог превзойти intel на десктопе, а вот в серверном сегменте при цене в 2 раза ниже он выглядит неплохо. Что'бы догнать intel фирме ARM потребуется ещё 10 лет,