Искусственный интеллект продолжает стремительно развиваться, и последние инновации от крупных технологических компаний обещают изменить ландшафт ИИ. Две новые модели - Claude 2 от Anthropic и Longnet от Microsoft - демонстрируют значительные улучшения в функциональности и масштабируемости по сравнению с предыдущими моделями.
Claude 2 от Anthropic, стартапа, основанного бывшими исследователями из OpenAI, демонстрирует впечатляющие conversational способности и возможность обрабатывать до 100,000 токенов - в 30 раз больше, чем ChatGPT. В тестах Claude 2 показал результаты на уровне и выше GPT-4. Компания постепенно расширяет доступность модели через Claude 2 API и бесплатную бета-версию чат-бота.
Microsoft Longnet использует механизм расширенного внимания, чтобы достичь невероятной длины последовательности в 1 миллиард токенов - эквивалентно 750 миллионам слов. Это позволяет модели обрабатывать данные масштаба всего Интернета. Пока Longnet находится на стадии концепции, но потенциально может принести прорыв в обучении с подкреплением и мультимодальных моделях.
Эти новые модели демонстрируют быстрое развитие возможностей ИИ. Большие языковые модели становятся все более мощными и масштабируемыми. Это открывает новые горизонты для практических приложений ИИ во многих областях. Остается посмотреть, как эти модели будут развиваться дальше и какое влияние окажут на нашу жизнь.