Голосовой набор на Андроид: как пользоваться? Преобразование речи в текст с помощью онлайн-сервисов.

27.09.2019 Windows

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Одно время мне приходилось печатать до 50 тыс. символов текста в день! Конечно, это не могло не провоцировать на поиски специальных программных движков для ввода текста голосом.

Буквально пару лет назад это было практически невозможно, так как все подобные программы работали на западе и были заточены, соответственно, под английский язык.

На данный момент времени ситуация изменилась в лучшую сторону. Теперь любой копирайтер может существенно упростить свои повседневные задачи.

Естественно, не все так просто. Честно признаться, я сам немного использовал описываемый сервис, но потом решил от него отказаться, так как мне показалась данная разработка еще сыроватой. Хотя опять же, если сравнивать с тем, что было, например, в 2012 году – это просто чудо!

Сервис для голосового набора текста

Итак, речь идет о сервисе speechpad.ru . Перейдя на этот сайт, вы увидите внизу окошко по типу стандартного блокнота. В данном случае — это голосовой блокнот. Здесь будет отображаться текст, введенный голосом.

Перед тем, как приступить к тестированию голосового движка, необходимо убедиться, что Ваш микрофон правильно подключен к компьютеру. Если с этим проблем нет, то можно нажимать клавишу «Включить запись»:

В поле №1 выводится текст, который Вы сказали за последние несколько секунд. Пока ваше предложение находится там, оно обрабатывается голосовым движком и распознает слова.

Затем всё надиктованное переносится во второе поле, где его уже можно отредактировать стандартными средствами — клавиатурой и мышкой.

Друзья, как я выше сказал, сервис не является таблеткой от клавиатурного ввода вообще. В принципе это и не мудрено! Ведь в случае появления идеально распознающего голос движка, востребованность копирайтеров и наборщиков текста сильно снизится и вообще это произведет настоящий фурор в интернет маркетинге.

Во всяком случае, я так думаю. Но вернемся к нашему голосовому блокноту и обещанным советам.

  1. Не спешите и четко (ОЧЕНЬ четко!) выговаривайте каждое слово.
  2. Если вы видите, что в первом поле предложение слегка зависло – не торопитесь надиктовать сверху лишний текст, так как бывают случаи, когда программа просто отрубается. Приходится заново включать запись и вновь начитывать испорченное предложение.
  3. Отрегулируйте микрофон так, чтобы он не фиксировал Ваше дыхание, так как это негативно влияет на запись текста и его распознавание.
  4. Редактируйте текст ручками прямо во втором поле, сразу после успешной записи одного предложения. Выключать запись при этом не нужно, но следите за тем, чтобы слишком долгая пауза автоматически не выбила запись. Я пробовал начитывать всю статью (конечно, не все распознавалось, и было достаточно ошибок) а потом сразу все редактировать в программе Word. Практика показала, что этот метод не эффективный. Лучше это делать на лету.

Со знаками препинания проблем не должно быть. Чтобы поставить запятую, не спеша и размеренно скажите в нужном месте «ЗАПЯТАЯ», или «ТОЧКА», или «ВОСКЛИЦАТЕЛЬНЫЙ ЗНАК». В этом плане все работает отлично и мне не приходилось почти ничего изменять в ручном режиме.

Дополнительные возможности голосового ввода

Кроме стандартных возможностей онлайн сервиса, вы можете установить дополнительное расширение в Chrome для того, чтобы использовать голосовые команды в любом поле.

Более того, разработчику удалось создать интеграционный модуль для операционной системы Windows. С его помощью можно управлять различными программами и функциями Виндовс одним лишь голосом.

Скачать и первое, и второе приложение можно на том же сайте в этом абзаце:

Подробную инструкцию в этом направлении я не привожу, так как мне лично это не интересно, да и на сайте все подробно расписано. Кому это необходимо – смогут все установить самостоятельно.

Если Вам понравится сервис, то Вы сможете зарегистрироваться и много чего настроить на сайте под себя.

Современные технологии не стоят на месте, и сегодня для набора текста уже не обязательно пользоваться стандартной клавиатурой. Голосовой ввод есть на большинстве устройств. Тем не менее далеко не все пользователи знают, как его правильно применять, и какую функцию он выполняет.

Для чего нужен ввод голосом

  • пользоваться поисковиками намного быстрее;
  • набирать сообщения в социальных сетях и популярных мессенджерах;
  • отвечать на СМС-сообщение, находясь за рулем;
  • быстро находить контакт в записной книжке телефона;
  • набирать текст в "Гугл-документах".

В браузере Google Chrome

Чтобы быстро набрать текст в режиме онлайн, достаточно выполнить несколько простых шагов:

  1. Включить микрофон.
  2. Открыть документ в браузере «Хром».
  3. Нажать «Инструменты» и выбрать «Голосовой ввод». Должна появиться иконка микрофона.
  4. Нажать на этот значок (он должен загореться красным цветом) и начать диктовку.
  5. Чтобы закончить ввод текста, достаточно еще раз кликнуть на иконку микрофона. Он должен стать серым.

Слова нужно произносить максимально четко, медленно и громко. Если использовать встроенный микрофон ноутбука, то система не поймет половину слов - и на выходе получится нечитаемый текст.

В некоторых ситуация может понадобиться надиктовать заметку докладчика для презентации. В этом случае необходимо:

  1. Убедиться, что микрофон хорошо работает.
  2. Открыть презентацию.
  3. Нажать «Инструменты» и выбрать «Продиктовать заметки…». После этого должен появиться значок микрофона.
  4. Нажать на его иконку и начать диктовку.
  5. Чтобы прекратить голосовой ввод, необходимо повторно нажать на значок микрофона.

При этом требуется хорошее подключение к интернету, иначе функция не активируется.

На телефоне

  1. Установить курсор таким образом, чтобы появилась стандартная клавиатура.
  2. Нажать на значок с микрофоном. Обычно он находится слева от клавиши пробела. Если иконки нет, то нужно зажать значок с изображением Земли (смена языка) и выбрать «Голосовой ввод Google».
  3. После этого на экране появится изображение микрофона и автоматически начнется запись текста.
  4. Когда диктовка будет завершена, достаточно подтвердить запись.

Подобным образом можно набирать СМС-сообщения, искать людей в записной книжке, пользоваться поисковиками, писать заметки и многое другое.

На Mac

Чтобы активировать интерактивный ввод текста, необходимо:

  1. Перейти в меню Apple (клавиша с изображением яблока).
  2. Нажать на «Системные настройки» и кликнуть на «Клавиатура». После этого необходимо активировать функцию «Диктовка».

В этом меню можно произвести следующие настройки:

  • активировать функцию улучшенной диктовки (работает в оффлайне);
  • выбрать язык и диалект;
  • указать используемый микрофон (встроенный или внешний);
  • задать наиболее удобную комбинацию клавиш, которая будет использоваться для быстрого начала и окончания записи.

Если в OS Mac установлена программа Siri, то активировать диктовку можно и через нее.

  1. Открыть документ или любое другое текстовое поле.
  2. Установить точку в том месте, откуда должен начать набираться текст.
  3. Нажать заданную ранее комбинацию клавиш (по умолчанию запись активируется при двойном клике на Fn). Также можно перейти во вкладку «Правка» и выбрать там «Начать диктовку».
  4. Произнести текст и сохранить его.
  5. Завершить диктовку нажатием на «Готово» или Fn.

Частые ошибки

Иногда функция не работает или выдает ошибки. Чаще всего пользователи сталкиваются со следующими проблемами:

  • «Вас плохо слышно». Если на экране появилась такая ошибка, то необходимо перейти в более тихое место, подключить другой микрофон или отрегулировать громкость устройства.
  • «Голосовые команды не работают». В этой ситуации необходимо говорить медленнее и громче. Между голосовыми командами рекомендуется делать паузы.
  • «Микрофон не работает». Если на экране всплывает такая ошибка, то нужно проверить, работает ли он на другом устройстве. Если микрофон исправен, необходимо проверить его настройки или перезагрузить компьютер или телефон.

Зная, как включить голосовой ввод, можно значительно упростить себе жизнь. Подобным образом пользователи могут набирать не только короткие текстовые сообщения, но и целые рассказы или инструкции. На планшетах эта функция активируется одним из описанных выше способов.

Одной из полезных функций в Android является голосовой набор. Научившись умело его использовать, можно сэкономить немало времени и выполнять множество операций, не прибегая к стандартной клавиатуре.

Такой вид набора даст возможность не отвлекаться на нажатие порой очень мелких клавиш. Это очень удобно, к примеру, когда вы находитесь за рулем автомобиля. Чтобы произвести необходимые действия, необходимо всего лишь продиктовать свои указания устройству. Но этому предшествует несколько элементарных действий, которые необходимо осуществить заранее.

Для начала следует поместить курсор таким образом, чтобы всплыла стандартная клавиатура. Кликните на изображение микрофона, и устройство перейдет в режим голосового ввода. Данное действие выполняется по-разному в зависимости от устройства и версии системы. В большинстве случаев нужно найти на одной из кнопок (пробеле или смене языка) значок микрофона и зажать ее.


После этих действий на экране появится готовая к применению панель ввода голосом. Использовать ее можно не только для вызовов или наборов SMS-сообщений, но и в браузере. Это очень удобно, особенно когда необходимо набрать длинное сообщение для отправки или любой другой текст.

В этот момент на экране устройства будет индикатор в виде микрофона. Внимательно следите за красной рамкой вокруг него. Ее толщина свидетельствует о громкости вашего голоса. После произнесения слова, оно будет мгновенно обработано и распознано, после чего высветится в специальном поле.

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API


Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper

Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…