Наступне покоління Siri працюватиме на основі генеративного чат-бота зі штучним інтелектом, і аналітики очікують, що він буде запущений з iOS 18, а його анонс відбудеться на цьогорічній конференції WWDC.
Хоча Apple критикували за відставання Siri, у новому звіті йдеться про те, що це пов’язано з тим, що компанія прагне бути набагато амбітнішою, ніж існуючі системи генеративного ШІ …
AppleGPT
Хоча компанія не робила жодних заяв про свою роботу над генеративним ШІ, у звіті, опублікованому ще влітку, говорилося, що компанія вже створила власну систему великої мовної моделі (LLM), яка отримала назву AppleGPT.
Наразі цей інструмент використовується лише всередині компанії, але в звіті зазначалося, що “люди, знайомі з цією роботою, вважають, що Apple має намір зробити важливе оголошення, пов’язане зі штучним інтелектом, наступного року”.
Хоча цей звіт викликав достатньо ажіотажу, щоб викликати стрибок акцій AAPL, ми тоді попереджали, що користувачам не варто очікувати на використання нової потужної служби Siri найближчим часом.
Цілі Apple набагато амбітніші, ніж ChatGPT
Хоча Apple може запустити свій власний LLM вже завтра, компанія прагне випередити такі системи, як ChatGPT, двома шляхами:
- Обробка на пристрої
- Вийти за рамки обробки мови, включивши в неї аудіо та відео зі штучним інтелектом
- Обробка на пристрої
Такі системи штучного інтелекту, як ChatGPT, виконують всю свою обробку на віддалених серверах, але дослідження, проведені Apple, свідчать про те, що компанія має набагато амбітнішу мету: використовувати обробку даних на пристроях.
Це дало б перевагу в швидкості та конфіденційності, але забезпечення роботи таких сервісів в обмеженій пам’яті мобільних пристроїв є величезним викликом – і це, як вважають, є ключовою причиною того, що компанія не поспішає з запуском.
Ми вже бачили, як компанія зробила один маленький крок до цієї мети: у вересні в останніх моделях Apple Watch була запущена автономна Siri.
Аудіо та відео зі штучним інтелектом, а також мова
ChatGPT відомий як LLM, оскільки мова йде про обробку мови. Але амбіції Apple виходять за рамки цього, прагнучи включити ШІ-обробку як відео, так і аудіо.
Ми знову побачили деякі ранні ознаки цього: візуальну та аудіо-обробку ШІ можна побачити у функціях “Відчинення дверей” та “Живі субтитри”.
Очікується запуск Siri наступного покоління в iOS 18
Financial Times повідомляє про очікуваний запуск набагато потужнішої версії Siri.
Всесвітня конференція розробників Apple, яка зазвичай проходить у червні, очікується як захід, на якому компанія представить свою останню операційну систему iOS 18. Аналітики Morgan Stanley очікують, що мобільне програмне забезпечення буде орієнтоване на підтримку генеративного штучного інтелекту і може включати голосовий помічник Siri, що працює на базі LLM […].
“Що стосується чіпів у їхніх пристроях, то вони, безумовно, все більше і більше орієнтуються на ШІ з точки зору дизайну та архітектури”, – сказав Ділан Патель, аналітик консалтингової компанії SemiAnalysis, що спеціалізується на напівпровідникових технологіях.
Це перегукується з повідомленням витоку інформації про Apple на початку цього місяця, а Morgan Stanley вказує на списки вакансій Apple як на додатковий доказ.
Майже половина оголошень про вакансії в сфері ШІ від Apple зараз включає термін “глибоке навчання”, який стосується алгоритмів, що живлять генеративний ШІ – моделей, які можуть вивергати людський текст, аудіо та код за лічені секунди.