Реализовать алгоритм на основе graph attention network
2) В самой этой схеме (Fig 1) есть Encoder. В качестве него можно взять ResNet18, но без последнего слоя - average polling + FC.
3) Далее надо взять саму GAT. Например, вот такую реализацию.
4) Далее, взять какую-нибудь базу данных лиц. Важно, чтобы размер изображений подходил под ResNet18, иначе надо будет делать resize.
5) Собрать все воедино. То есть, на входе подается лицо, далее идет ResNet18, далее - GAT. Дальше надо смотреть по схеме, но если не ошибаюсь, дальше идет некий вектор, потом FC и метки человека (подробнее могу описать в сообщениях).
6) Обучить