Браузери з функцією відтворення тексту голосовим движком

Голосові движки - це програмне забезпечення, що синтезує людську мову. Їх використовують для прослуховування книг, будь-якій іншій текстової інформації, на їх базі працюють голосові асистенти. Синтезованої мови поки що далеко до мови людини, голосові движки ще не можуть передавати вираз, постановку акцентів, емоції. Проте вони несуть в собі рішення для людей з аудіальним типом сприйняття інформації. Технологія синтезу мови давно вже присутній в середовищі Windows, більш того, система поставляється зі своїми голосовими движками. Цю технологію ми навіть можемо використовувати під час перегляду сайтів для прочитання веб-публікацій у вікнах браузерів. Не всі браузери підтримують таку можливість, але у сучасних популярних вона точно є. Що це за браузери? І як в них реалізовано відтворення веб-публікацій голосовими движками?

Браузери з функцією відтворення тексту голосовим движком


1. Microsoft Edge


Microsoft Edge - рідний браузер Windows 10 - багато в чому ще далекий від рівня і потенціалу Chrome і Firefox, але компанія Microsoft активно удосконалює цей продукт. І в ньому є можливість відтворення тексту синтезованої промовою. Необхідно виділити блоком перше слово місця, з якого потрібно почати читати, і, власне, запустити саму цю функцію.

Функція передбачає відстеження відтворення - синім блоком виділяється читається ділянку, жовтим маркером відсвічується конкретне відтворюється слово. Ефектніше відстеження працює в режимі читання Edge: тут вся сторінка затінюється легкої вуаллю, недоторканим залишається тільки відстежується блок.

Більш того, в цей режим вбудовано імерсивні засіб читання - спеціальний набір опцій для навчання дітей читання, який компанія Microsoft, піклуючись про підростаюче покоління своїх користувачів, нині активно впроваджує у свої продукти. Ці кошти в комплексі з синтезованою промовою можна використовувати не тільки для навчання дітей, а й для спрощення вивчення дорослими іноземних мов.
При відтворенні тексту можемо перемикатися на наступний / попередній абзац публікації кнопками "Next / Previous" або кліком миші вказувати конкретні місця, з яких потрібно почати читати. Мова налаштовується: можемо змінювати її швидкість і вибирати голос диктора.

Мінус Microsoft Edge полягає в тому, що він дозволяє відтворювати текст тільки штатними двигунами Windows - чоловічим голосом Павла або жіночим Ірини. Вони непогані, але все ж далекі від ідеалу. Сьогоднішній ринок IT-технологій може запропонувати більш якісні рішення, в тому числі і в частині російськомовної синтезованої мови. Платні якісні движки, що впроваджуються в середу Windows, є у компаній Acapela Group, Loquendo, Ivona. Але, на жаль, будь-які сторонні голосові движки не підтримуються браузером Edge. Зате їх підтримують інші веб-оглядачі.

2. Mozilla Firefox


Давно вже Mozilla Firefox хоче потрапити в розряд браузерів "з коробки". Залишаючись як і раніше доповнюються розширеннями браузером, він тим не менше передбачає ряд нативних призначених для користувача функцій, причому реально придатних функцій. Одна з них - вбудований режим читання з підтримкою відтворення тексту. Відтворена мова налаштовується в частині вибору швидкості і голосового движка. З таких - вбудований в Windows диктор Ірина та встановлені в систему сторонні движки. Відтворення можна перемикати на наступний / попередній абзац кнопками "Next / Previous".

Відтворений текст відстежується виділенням блоком читаного абзацу та відміткою конкретного слова рухомим курсором у вигляді нижнього накреслення.


3. Google Chrome і Chromium-браузери


У числі нативного функціоналу Google Chrome немає ні функції відтворення мови, ні навіть рідного режиму читання. Але все це легко можна організувати, встановивши в сам Chrome і браузери на базі Chromium-платформи, які працюють з магазином контенту Chrome, спеціальні розширення. Що це за розширення?
Reader View
Розширення Reader View - це реалізований в браузерах Chrome, Firefox і Opera режим читання з підтримкою функції відтворення тексту. У Firefox і в Опері це розширення реалізує точно такі ж можливості, як і штатний режим читання Firefox - відстеження відтвореного тексту, вибір швидкості, кнопки перемикання між абзацами. Більш того, розширення Reader View в частині реалізації самого режиму читання схоже з цим режимом, вбудованим в Firefox.

Розширення також дозволяє вибирати голосові движки з числа вбудованого в Windows диктора Ірини і сторонніх встановлених в системі голосів. А ось в реалізації для браузера Chrome Reader View може запропонувати ще й додаткові движки - якісну російськомовну мова, розробку компанії Google і голоси для інших мов. Для англійської мови ж і зовсім додатково підтримуються движки iSpeech і SpeakIt !, що працюють не на рівні Windows, а всередині самого Chrome за рахунок реалізації іншими розширеннями, наприклад, SpeakIt !. До речі, про нього.
SpeakIt!
Розширення SpeakIt! - це не режим читання з функцією відстеження тексту, механізм відтворення тексту тут досить примітивний. Просто виділяємо блоком текст, який потрібно прочитати, і стартуємо функцію. Далі все, що можемо зробити з цим процесом - це призупинити або вимкнути його.

Розширення SpeakIt! має значний перелік підтримки двигунів - як системних, так і реалізованих власними коштами. Правда, для російської мови вибір невеликий: рідний диктор Windows Ірина, встановлені в систему сторонні голоси і фірмовий движок Google.

Раніше цей перелік був ширше за рахунок реалізації ще двох російськомовних дикторів в складі движка iSpeech. Зараз вони чомусь не працюють, але, можливо, ситуація виправиться в майбутньому. Благо, розширення дозволяє наявні голоси моделювати на свій смак - налаштовувати не тільки їх швидкість, але також висоту.

Мітки до статті: Браузери Google Chrome Mozilla Firefox