Удивительно, как далеко продвинулись мобильные телефоны за последние 20 лет. В 2000 году самым заметным нововведением стали полифонические рингтоны; в 2005 — встроенные камеры и цветные экраны; в 2009 — появление сенсорных экранов и магазинов приложений.
А в 2015 году — внедрение распознавания отпечатков пальцев и мобильных кошельков (по данным Deloitte, 47% респондентов уже используют телефоны для оплаты товаров и услуг в офлайн-магазинах).
Однако современные смартфоны уже способны предсказывать следующее слово, распознавать лица, естественно преодолевать языковые барьеры и даже редактировать фотографии. Движущей силой всей этой «умности» и автономности в значительной степени является искусственный интеллект (ИИ).
Для производителей смартфонов, в свою очередь, возможность предложить широкий набор ИИ-функций становится крайне важной. Поскольку доля смартфонов с поддержкой ИИ, как ожидается, будет стремительно расти в ближайшие годы, искусственный интеллект уже становится ключевым фактором при выводе новых продуктов на рынок.
В этой статье мы рассмотрим, как ИИ работает внутри мобильных устройств, какие технологии лежат в его основе и как выбрать компанию по разработке ИИ, которая поможет внедрить интеллектуальные функции в ваше мобильное приложение.
Ведущие ИИ-компании в мире в 2025 году по рыночной капитализации, CompaniesMarketCap
Что такое ИИ в мобильных телефонах?
По сути, ИИ в мобильных устройствах означает интеграцию интеллектуальных алгоритмов в смартфоны, позволяющих им обучаться на основе поведения пользователя и выполнять задачи, которые ранее были возможны только при наличии человеческого мышления.
Определение ИИ в смартфонах чаще всего сосредоточено не столько на аппаратной части, сколько на интеграции функций и пользовательского опыта, основанных на ИИ.
В отличие от ПК с поддержкой ИИ, где ключевым маркетинговым фактором было наличие специализированного ИИ-чипа или ускорителя, классификация смартфона с ИИ обычно определяется тем, какие возможности он предоставляет пользователю.
Как работает искусственный интеллект в смартфонах
Функции ИИ могут выполняться либо непосредственно на устройстве, либо в облаке.
- ИИ на устройстве обрабатывает данные локально, что обеспечивает более быстрый отклик, повышенную безопасность и возможность работы без подключения к интернету.
- Облачный ИИ использует удаленные серверы для выполнения более сложных вычислений, таких как крупные языковые модели или анализ данных в реальном времени.
Однако большинство современных смартфонов используют гибридный подход, сочетая оба варианта для достижения оптимальной производительности и энергоэффективности.
Кроме того, ИИ в смартфонах основан на ряде базовых технологий — машинном обучении (ML), глубоком обучении (DL) и нейронных сетях, каждая из которых выполняет свою функцию.
- Нейронные сети имитируют структуру человеческого мозга и служат основой для большинства современных моделей ИИ.
- Глубокое обучение — это более продвинутая форма нейронных сетей, использующая множество слоёв для обработки сложных данных, таких как речь, изображения и жесты — фактически масштабируя классические нейронные сети для повышения производительности.
- Большие языковые модели (LLM), являясь частью глубокого обучения, специализируются на понимании и генерации естественного языка. Сегодня они адаптируются для мобильных устройств — для генерации текста в реальном времени, перевода и разговорного ИИ.
- Машинное обучение (ML) остаётся более широкой областью, в рамках которой развиваются нейронные сети и глубокое обучение.
Как ИИ работает на смартфонах
Ключевые технологии ИИ в современных смартфонах
Машинное обучение, глубокое обучение и нейронные сети не работают изолированно — для реализации в реальных сценариях им требуются специализированные методы обработки и аппаратные компоненты.
Нейронные процессоры (NPU)
В основе смартфонов с ИИ лежит нейронный процессор (NPU) — специализированный чип для обработки задач ИИ и машинного обучения.
В отличие от обычных CPU или GPU, которые выполняют вычисления общего назначения, NPU оптимизированы для параллельной обработки большого количества операций, связанных с ИИ. Они обеспечивают работу таких функций, как обработка фотографий, перевод в реальном времени, предиктивный ввод текста и рекомендации приложений.
Обработка естественного языка (NLP)
Обработка естественного языка (NLP) позволяет смартфонам понимать и интерпретировать человеческую речь. Это ключевая технология, лежащая в основе голосовых ассистентов, позволяющая им распознавать речь пользователя, понимать её смысл и формировать естественные ответы.
Современные системы NLP способны учитывать тон, контекст и даже сленг, делая взаимодействие более реалистичным. Помимо голосовых команд, эта технология используется в умных ответах в сообщениях, голосовом вводе текста и переводах.
Компьютерное зрение и распознавание изображений
Компьютерное зрение даёт смартфонам возможность «видеть» и понимать окружающий мир. С помощью глубокого обучения и больших объёмов визуальных данных устройства могут с высокой точностью распознавать лица, объекты и сцены.
Эта технология лежит в основе множества функций камеры, которыми мы пользуемся ежедневно — портретный режим, ночная съёмка, автоматическое распознавание сцены, Face ID и визуальный поиск.
Edge AI (ИИ на устройстве)
Edge AI означает, что смартфон может выполнять задачи ИИ непосредственно на устройстве, не отправляя данные в облако. Это повышает производительность, снижает задержки и усиливает защиту данных, поскольку личная информация не покидает устройство.
Смартфоны со специализированными ИИ-чипами, такими как Apple Neural Engine или Google Tensor, используют Edge AI для обработки фотографий в реальном времени, мгновенного перевода и предиктивного ввода текста. В целом это позволяет устройству оставаться «умным», быстрым и безопасным без зависимости от облачных сервисов.
Повседневные применения ИИ в мобильных телефонах
Многие ведущие производители смартфонов уже продемонстрировали потенциал ИИ в пользовательских интерфейсах, предлагая широкий набор инструментов для редактирования, помощи и улучшения пользовательского опыта, доступных по нажатию, свайпу или с помощью голоса.
Рассмотрим, как искусственный интеллект применяется на практике в различных сценариях использования мобильных устройств.
Мобильная фотография и видеосъёмка
Камеры смартфонов — один из самых продвинутых примеров использования ИИ. Обработка изображений с применением ИИ использует сверточные нейронные сети (CNN) для анализа освещения, цвета и композиции кадра в реальном времени.
Когда пользователь делает снимок, нейропроцессор (NPU) в смартфоне за миллисекунды запускает множество алгоритмов, чтобы определить тип сцены — пейзаж, портрет или ночная съёмка — и автоматически настроить экспозицию, баланс белого и глубину.
В портретной съёмке ИИ использует семантическую сегментацию, чтобы отделить объект от фона и размыть его, имитируя эффект глубины резкости зеркальных камер. Для съёмки при слабом освещении применяется объединение нескольких кадров (multi-frame stacking): делается серия снимков, которые затем объединяются в одно изображение высокого качества с меньшим уровнем шума.
ИИ также поддерживает оптимизацию HDR и стабилизацию видео в реальном времени с использованием предиктивного отслеживания движения.
Некоторые смартфоны, например серия Google Pixel, используют методы вычислительной фотографии на основе машинного обучения для восстановления естественных оттенков кожи или удаления нежелательных объектов с изображений.
Голосовые ассистенты
Голосовые ассистенты, такие как Siri, Google Assistant и Bixby, используют обработку естественного языка (NLP) и автоматическое распознавание речи (Speech-to-Text, STT), чтобы преобразовывать устную речь в команды, понятные системе.
Когда пользователь обращается к ассистенту, его голос сначала анализируется с помощью акустического моделирования для распознавания фонем — базовых звуковых единиц речи.
Затем языковые модели интерпретируют контекст и намерение, преобразуя фразы вроде «Напомни мне позвонить Алексу в 6» в выполняемые задачи.
ИИ также использует контекстное обучение: со временем ассистент становится «умнее», анализируя прошлые запросы, календарь и даже геолокацию пользователя.
Например, если пользователь регулярно спрашивает прогноз погоды перед выходом из дома, система может начать автоматически предоставлять эту информацию.
Наконец, технология преобразования текста в речь (Text-to-Speech, TTS) позволяет ассистенту генерировать естественные, близкие к человеческой речи ответы прямо на устройстве, делая взаимодействие более плавным и разговорным без необходимости обращения к облачным сервисам.
Предиктивный ввод и умный набор текста
За каждой подсказкой автодополнения стоят рекуррентные нейронные сети (RNN) или модели на базе трансформеров, обученные на миллионах языковых примеров. Эти модели предсказывают следующее слово пользователя на основе вероятности, учитывая его стиль набора текста, часто используемые фразы и предпочтения в эмодзи.
ИИ также обеспечивает интеллектуальную автокоррекцию, которая не просто исправляет ошибки, но и понимает смысл.
Например, система определяет, что пользователь имел в виду «meeting», а не «meting», исходя из контекста предложения. Со временем клавиатура адаптируется к индивидуальному стилю пользователя, повышая точность с каждым использованием.
Персонализация и рекомендации
ИИ непрерывно анализирует взаимодействие пользователя с устройством, чтобы обеспечить персонализированный мобильный опыт. Используя поведенческий анализ, обучение с подкреплением и контекстное моделирование, смартфоны могут в реальном времени предсказывать конкретные потребности пользователя.
Например, устройство может рекомендовать приложения, которые пользователь часто открывает в определённое время суток, или автоматически включать режим энергосбережения при низком уровне заряда батареи.
Музыкальные и видеосервисы используют методы коллаборативной фильтрации, предлагая новый контент на основе предпочтений пользователя.
Системная персонализация, такая как адаптивная яркость, использует датчики окружающей среды и модели ИИ, чтобы подстраиваться под индивидуальные предпочтения в зависимости от условий освещения.
Безопасность и аутентификация
Безопасность на базе ИИ обычно основана на биометрической идентификации и обнаружении аномалий.
Для технологий вроде Face ID или разблокировки по лицу смартфон создает карту глубины и обрабатывает ее с помощью трёхмерной сверточной нейронной сети (3D-CNN), обученной распознавать уникальные черты лица даже при небольших изменениях внешности.
Распознавание отпечатков пальцев также значительно продвинулось: ИИ устраняет шум в данных сенсора и применяет алгоритмы сопоставления шаблонов для более быстрой и надежной аутентификации.
Поведенческий ИИ идёт ещё дальше — он может анализировать то, как человек взаимодействует со смартфоном (скорость набора текста, угол наклона устройства, сила нажатия), чтобы выявлять подозрительную активность или потенциальное мошенничество.
Мобильные игры и дополненная реальность (AR)
В играх ИИ управляет неигровыми персонажами (NPC), используя деревья решений, обучение с подкреплением или поведенческое моделирование для создания динамичного и отзывчивого игрового процесса. Такие персонажи могут адаптироваться к стилю игры пользователя, делая каждую игровую сессию более реалистичной.
В дополненной реальности ИИ улучшает понимание пространства с помощью технологии одновременной локализации и картографирования (SLAM) — процесса, который позволяет смартфону в реальном времени строить карту физического пространства.
В сочетании с распознаванием объектов и определением глубины это позволяет приложениям, таким как Pokémon GO, или инструментам AR-навигации интегрировать цифровые объекты в реальный мир.
Автоматизация
ИИ все чаще используется для автоматизации повторяющихся задач. С помощью триггеров, основанных на контексте, и моделей машинного обучения, работающих по правилам, смартфон может автоматически отключать уведомления во время встреч, регулировать энергопотребление в зависимости от активности или выполнять плановое обслуживание в фоновом режиме.
| Область | Как работает ИИ | Примеры / функции |
| Фотография и видео | CNN и NPU автоматически настраивают освещение, фокус и глубину | Распознавание сцен, портретное размытие, ночная съемка (stacking), HDR, стабилизация видео |
| Голосовые ассистенты | NLP интерпретирует речь и учитывает контекст | Siri, Google Assistant, Bixby; напоминания, контекстные подсказки |
| Предиктивный ввод | RNN/трансформеры предсказывают слова и адаптируются | Автодополнение, подсказки эмодзи, исправления с учетом контекста |
| Обработка текста (на базе LLM) | Большие языковые модели суммируют, переписывают и генерируют текст | Резюмирование, изменение тона, умные ответы, генерация контента |
| Персонализация | Поведенческий анализ адаптирует пользовательский опыт | Рекомендации приложений, адаптивная яркость, персональные рекомендации контента |
| Безопасность | Биометрия и поведенческий ИИ повышают уровень защиты | Face ID, распознавание отпечатков, обнаружение мошенничества |
| Игры и AR | ИИ адаптирует NPC и строит карту пространства в AR | Динамичный геймплей, приложения AR, такие как Pokémon GO, навигация |
| Автоматизация | ML автоматизирует рутинные задачи | Умные уведомления, оптимизация батареи, планирование задач |
Ключевые применения искусственного интеллекта в мобильных телефонах
Преимущества и вызовы использования алгоритмов ИИ в смартфонах
Подавляющее большинство телеком-операторов рассматривают интеграцию ИИ как бизнес-необходимость. По состоянию на 2024 год почти 90% компаний по всему миру полностью или частично внедрили эту технологию хотя бы в одной области своего бизнеса, тогда как лишь 3% не планируют этого делать.
Неудивительно, что операторы в первую очередь стремятся повысить производительность. Однако для бизнеса существует и множество других преимуществ.
Например, ИИ улучшает производительность устройств и приложений. Современные смартфоны используют специализированное оборудование, такое как Apple Neural Engine или Google Tensor, для эффективного выполнения задач ИИ непосредственно на устройстве, что снижает задержки, экономит энергию и уменьшает затраты на инфраструктуру и поддержку.
Помимо производительности, ИИ усиливает безопасность и соответствие требованиям. Глубокое обучение повышает эффективность обнаружения мошенничества, проверки личности и поведенческой аутентификации, тогда как Edge AI и федеративное обучение позволяют хранить чувствительные данные на устройстве, обеспечивая соблюдение нормативных требований.
Наконец, ИИ повышает операционную эффективность. Он отслеживает работу систем, прогнозирует возможные проблемы, оптимизирует использование ресурсов и поддерживает работу чат-ботов или виртуальных ассистентов для выполнения рутинных задач.
В то же время внедрение ИИ сопровождается рядом сложностей. Первая из них — стоимость. Разработка и поддержка ИИ-систем требуют квалифицированных специалистов, высокопроизводительного оборудования и больших объемов данных.
Небольшим компаниям может быть сложно инвестировать в это, конкурируя с крупными игроками.
Кроме того, широкий спектр возможных применений ИИ приводит к тому, что организациям трудно определить, куда именно направлять ресурсы, особенно когда возврат инвестиций сложно точно оценить.
С технической точки зрения еще одной проблемой является фрагментация мобильных устройств. Различные операционные системы и аппаратные конфигурации могут ограничивать функциональность ИИ или требовать от разработчиков поддержки нескольких версий моделей.
Также сложные модели ИИ потребляют значительные вычислительные ресурсы и память, что может приводить к быстрому разряду батареи или перегреву устройств.
Разработчики могут использовать такие методы, как сокращение моделей (model pruning), квантование (quantization) и дистилляция знаний (knowledge distillation), чтобы сделать модели более легкими и быстрыми, однако это добавляет сложности в процесс разработки.
Конфиденциальность и этические аспекты: стоит ли полагаться на ИИ
По мере того как разработка приложений с использованием ИИ становится неотъемлемой частью мобильных бизнес-стратегий, компании сталкиваются с растущими рисками в области конфиденциальности и этики.
Прежде всего, системы ИИ в смартфонах основаны на огромных объемах персональных данных — от геолокации и биометрии (лицо, голос, отпечатки пальцев) до паттернов использования приложений.
Если такие данные используются неправомерно, утекут или будут получены незаконным путем, бизнесу грозят серьезные штрафы в рамках GDPR или CCPA, а также репутационные потери. Более того, чем шире применяется ИИ для персонализации в реальном времени, тем выше риск утечек.
Безопасность также остается одним из ключевых вопросов. Как ИИ на устройстве, так и облачные решения подвержены атакам, включая подмену данных, состязательные воздействия (adversarial input) и инверсию моделей — методы, направленные на извлечение или искажение внутренних данных модели.
Проблемы предвзятости и прозрачности не менее значимы. Модели ИИ обучаются на данных, которые могут содержать скрытые предубеждения, что приводит к несправедливым результатам, например, при распознавании лиц, рекомендациях контента или использовании в системах найма.
Наконец, поскольку многие модели глубокого обучения представляют собой «черные ящики», часто сложно объяснить, каким образом принимаются решения, что может вызывать вопросы как у регуляторов, так и у пользователей.
Кроме того, законодательство обычно отстает от технологического развития, поэтому компании, работающие в строго регулируемых отраслях, с большей вероятностью столкнутся со штрафами, проверками и проблемами с соблюдением требований, если технологии ИИ используются без должного контроля.
Кейсы: ИИ в ведущих смартфонах (издание 2025 года)
Несмотря на сохраняющиеся опасения пользователей, которые остаются барьером для внедрения, все лидеры рынка смартфонов стремятся интегрировать продвинутые функции ИИ — будь то ИИ на устройстве, облачные вычисления или специализированное оборудование, такое как нейронные процессоры.
Apple
Apple активно внедряет ИИ в мобильные устройства через Apple Intelligence, усиливая возможности iPhone за счет более интеллектуального ИИ-ассистента, инструментов для работы с текстом, функций с акцентом на конфиденциальность, перевода в реальном времени, генерации изображений, а также суммаризации писем и сообщений.
Компания также сотрудничает с OpenAI для интеграции ChatGPT в экосистему Apple Intelligence.
Ключевые функции Apple с поддержкой ИИ включают:
- Face ID: глубокое обучение для распознавания лица с защитой от подмены.
- Live Text / Object & OCR: извлечение текста из изображений и видео в реальном времени.
- Улучшения камеры: Smart HDR, ночной режим и вычислительная фотография используют нейронные сети для распознавания сцен, построения карты глубины и снижения шума.
- Предиктивный ввод: модели анализируют стиль набора текста и предлагают следующие слова и эмодзи.
Google продолжает лидировать в области ИИ благодаря своему чипсету Google Tensor и глубокой интеграции ИИ во всей экосистеме Pixel.
Ключевые функции ИИ включают:
- Magic Eraser и улучшение фото: удаление объектов и настройка освещения с помощью глубокого обучения.
- Фильтрация звонков (Call Screening): распознавание речи на устройстве фильтрует спам, а облачные NLP-модели обрабатывают сложные запросы.
- Перевод в реальном времени: частично выполняется на устройстве для скорости, с поддержкой облака для большего числа языков.
- Адаптивная батарея и производительность: ИИ прогнозирует использование приложений для оптимизации ресурсов и экономии энергии.
Samsung
Samsung позиционирует платформу Galaxy AI как ключевой элемент своей продуктовой стратегии. Среди основных функций ИИ: audio eraser, writing assist, transcript assist, browsing assist, call assist и drawing assist.
Система включает:
- Перевод в реальном времени и AR: модели компьютерного зрения для распознавания объектов, перевода текста и речи, а также AR-наложений.
- Smart Crop и ИИ в камере: распознавание сцен и улучшение съемки при слабом освещении с помощью нейронных сетей, а также редактирование фото (удаление, перемещение, добавление объектов).
- Адаптивное управление ресурсами: предиктивные модели регулируют нагрузку CPU/GPU и работу фоновых приложений.
- Мониторинг здоровья и биометрии: ИИ анализирует данные датчиков для отслеживания пульса, сна и уровня стресса.
Huawei, OnePlus и Xiaomi
Huawei, OnePlus и Xiaomi также активно инвестируют в ИИ для повышения производительности, персонализации и качества изображений.
Система XMAGE от Huawei использует продвинутые нейронные сети для настройки цвета и распознавания объектов, а нейронные процессоры Kirin выполняют задачи, такие как голосовые команды и распознавание сцен, непосредственно на устройстве.
OnePlus интегрирует ИИ в среду OxygenOS, обеспечивая умные уведомления, адаптивную настройку производительности и улучшенную четкость фотографий.
Xiaomi продолжает развивать возможности ИИ в HyperOS, внедряя улучшение портретов, контекстно-зависимых ассистентов и оптимизацию батареи на основе машинного обучения, выполняемого на устройстве.
Будущие тренды и инновации
Будущее ИИ в мобильных технологиях тесно связано с развитием интеллектуальных устройств в целом. Подобно ПК с ИИ, оснащенным NPU, смартфоны теперь также получают собственные чипы для обработки ИИ непосредственно на устройстве.
Apple, Samsung и Xiaomi внедряют эти возможности не только в флагманские модели, но и в устройства среднего сегмента, делая функции ИИ доступными для гораздо более широкой аудитории.
ИИ на устройстве также снижает зависимость от постоянного подключения к облаку, делая смартфоны быстрее, более приватными и энергоэффективными.
ИИ выходит за пределы смартфонов и распространяется на подключенные устройства, такие как носимая электроника, наушники и умные очки. В сфере расширенной реальности (XR) ИИ уже используется для перевода в реальном времени, распознавания жестов и 3D-картографирования, создавая более захватывающий и отзывчивый пользовательский опыт.
Почему стоит выбрать СКЭНД для разработки ИИ
В СКЭНД мы объединяем более 25 лет опыта в разработке программного обеспечения с глубокой экспертизой в области ИИ, помогая бизнесу создавать мобильные решения нового поколения.
Наша команда предоставляет полный цикл консалтинга по ИИ и разрабатывает интеллектуальные, высокопроизводительные приложения с использованием машинного обучения, компьютерного зрения, обработки естественного языка и ИИ на устройстве.
Мы работаем как с проприетарными, так и с open-source фреймворками, интегрируя такие инструменты, как TensorFlow Lite, Core ML и ONNX Runtime Mobile для эффективного выполнения моделей на устройстве.
Для клиентов, которым необходим полный контроль над данными, мы внедряем локальные большие языковые модели (LLM), такие как LLaMA или Mistral, а также используем пайплайны Retrieval-Augmented Generation (RAG) для получения более точных и контекстно-зависимых результатов.
Подход СКЭНД охватывает весь жизненный цикл разработки — от стратегии ИИ и проектирования архитектуры до разработки моделей машинного обучения, их дообучения, тестирования и внедрения. Для проектов, требующих дополнительных ресурсов, вы всегда можете привлечь инженеров по машинному обучению для усиления команды.
Независимо от задачи — будь то создание решений с акцентом на конфиденциальность, интеграция edge computing или оптимизация моделей — мы гарантируем максимально эффективный результат.
Часто задаваемые вопросы
Что делает ИИ в смартфонах?
ИИ в смартфонах помогает устройствам понимать, обучаться и адаптироваться к поведению пользователя. Он используется для оптимизации камеры, работы голосовых ассистентов, предиктивного ввода текста и рекомендаций приложений. Обрабатывая данные с помощью встроенных ИИ-чипов, смартфоны обеспечивают более «умную» и энергоэффективную работу.
Что такое NPU и почему он важен?
NPU (Neural Processing Unit) — это специализированный чип, разработанный специально для выполнения задач ИИ и машинного обучения. В отличие от традиционных CPU или GPU, NPU обрабатывает данные параллельно, что ускоряет такие операции, как обработка изображений или распознавание лиц.
Чем Edge AI отличается от облачного ИИ?
Edge AI обрабатывает данные непосредственно на смартфоне, не отправляя их на удаленные серверы. Облачный ИИ, в свою очередь, лучше подходит для анализа больших объемов данных и задач, требующих значительных вычислительных ресурсов.
Как ИИ улучшает мобильный маркетинг и бизнес-приложения?
ИИ позволяет компаниям анализировать данные пользователей, прогнозировать поведение и предлагать персонализированную рекламу. Он также помогает создавать более продуманный дизайн приложений, проводить аналитику в реальном времени и адаптировать интерфейсы. Маркетологи используют ИИ для автоматизации кампаний, оптимизации голосового поиска и улучшения взаимодействия с пользователями.
Есть ли риски для конфиденциальности при использовании ИИ в смартфонах?
К сожалению, да. Вопросы конфиденциальности остаются актуальными. Приложения с ИИ используют пользовательские данные для обучения, что создает риски их неправомерного использования или несанкционированного доступа.
Какое будущее ждет ИИ в смартфонах?
Будущие смартфоны будут оснащаться более мощными ИИ-чипами и активно использовать генеративный ИИ для проактивной помощи — например, предсказывать потребности пользователя, автоматизировать задачи и обеспечивать новые возможности для творчества в реальном времени.