Remkomplekty.ru

IT Новости из мира ПК
28 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Ошибка синтезирования речи

Ошибка синтезирования речи

Speech Application Programming Interface или SAPI — это пакет речевых функций, разработанный корпорацией Microsoft для того, чтобы программы могли использовать компьютерный синтез речи. Существуют две основные версии SAPI (SAPI 4 и SAPI 5), которые не совместимы друг с другом.

Операционная система Windows 2000 содержала SAPI 4, Windows XP и все последующие версии — SAPI 5. Можно загрузить и установить обе версии SAPI на один компьютер; это позволит использовать все существующие речевые движки (старые и новые).

Голос Microsoft Pavel Mobile предназначен для использования в приложениях из магазина Windows Store. По умолчанию к голосу нельзя обратиться при помощи функций SAPI 5. Однако, есть простой способ решить данную проблему. Скачайте архив, извлеките из него файл для соответствующей версии операционной системы («pavel_x86.reg» для 32-битной версии и «pavel_x64.reg» для 64-битной версии), кликните правой кнопкой мыши на имени файла и выберите пункт «Слияние» в контекстном меню. Параметры голоса будут добавлены в системный реестр Windows, и голос можно будет использовать в программе «Балаболка».

Файлы для других языков можно скачать отсюда.

Изменение ударения поддерживается только для русских голосов RHVoice. Для этого можно использовать специальный символ, заданный в файле конфигурации. Например, символ «плюс»:

Файл конфигурации находится здесь: %APPDATA%RHVoiceRHVoice.ini, в кодировке UTF-8. После внесения изменений в файл конфигурации необходимо перезапустить программу «Балаболка». В тексте символ стоит перед гласной, которая должна получить ударение: навесной зам+ок.

XML означает Extensible Markup Language (расширяемый язык разметки). Это способ обработки текста при помощи обрамляющих тегов, когда отдельные слова или предложения превращаются в элементы, обрабатываемые компьютерными голосами специальным образом.

Теги — это текстовые управляющие команды, вставляемые в читаемый текст, причем они сами не читаются, а передают речевому синтезатору команду изменить тот или иной параметр чтения текста. Каждый элемент XML состоит из стартового тега , завершающего тега и текста между этими двумя тегами. Если элемент пустой и текст отсутствует, то тег может быть записан так: .

С помощью тегов можно изменить, например, скорость чтения:

Этот текст читается со скоростью пять.

Подробную информацию о тегах можно найти в файле справки программы «Балаболка».

Можно воспользоваться тегами SAPI 5. Рекомендуется вставлять стартовый тег и парный ему завершающий тег внутрь одного и того же абзаца. Например:

Привет, как дела?
Всё в порядке.

Формат DjVu был разработан для хранения сканированных документов; в DjVu-файлах в сжатом виде хранятся графические изображения страниц книг, журналов и т.д. Также, формат DjVu предусматривает наличие текстового (OCR) слоя, который содержит текст со страницы. Файлы с текстовым слоем иногда обозначают как DjVu+OCR.

Программа «Балаболка» умеет извлекать данные лишь из текстового слоя. В случае, если текстовый слой недоступен, единственный метод получения текста — это выполнение оптического распознавания, например, в FineReader.

^p знак абзаца ^t знак табуляции ^nnn знак ASCII (где nnn — код знака) ^0nnn знак ANSI (где 0 — это ноль, а nnn — код знака) ^Unnnnn знак в кодировке Юникод (где nnnnn — код знака) ^+ длинное тире ( — ) ^= короткое тире ( – ) ^^ знак крышки ^s неразрывный пробел ^? любой знак (только в поле «Найти») ^# любая цифра (только в поле «Найти») ^$ любая буква (только в поле «Найти») ^c содержимое буфера обмена Windows (только в поле «Заменить на») ^& содержимое поля «Найти» (только в поле «Заменить на»)

Процесс извлечения текста из файлов формата PDF достаточно сложен, так как файл PDF не содержит обычный текст. Вы можете использовать для извлечения текста внешнюю программу, поддерживающую передачу параметров в командной строке. Например, утилиту pdftotext.exe из состава проекта Xpdf. Скопируйте pdftotext.exe в подкаталог «utils» в папке программы «Балаболка», выберите пункт главного меню «Настройки | Импорт текста», вкладку «Внешние программы для импорта текста», и нажмите кнопку «Добавить». Задайте команду для использования pdftotext.exe:

%BFolder%utilspdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%

Введите имя для данного формата (например, «Xpdf Converter»), расширение файла («PDF») и кодировку текста («UTF-8»). После того, как будет выбран пункт Использовать вместо метода извлечения текста по умолчанию для данного формата файлов, программа сможет использовать внешнюю утилиту для извлечения текста из файлов формата PDF.

Программа позволяет использовать разные кодеки для создания звуковых файлов. Необходимо указать командную строку для вызова внешней программы; например, можно использовать утилиту FLAC.EXE, созданную некоммерческой организацией Xiph.Org Foundation. В программе «Балаболка» выберите пункт главного меню «Настройки | Аудиофайлы», вкладку «Другие кодеки». Нажмите кнопку «Добавить» и укажите значения для параметров: название (например, «Аудиофайлы FLAC»), расширение файла (FLAC) и командную строку.

C:Utilsflac.exe %Input% -o %Output%

Переменная %Input% обозначает имя входного файла с расширением WAV (файл формата RIFF WAVE), переменная %Output% — имя звукового файла в формате FLAC. Файл FLAC.EXE можно скопировать в ту же папку, где находится «Балаболка»; переменная %BFolder% обозначает путь к этой папке.

Могу предложить такой способ. Добавьте в текстовый файл по две пустых строки после каждой строки: выберите пункт главного меню «Правка | Заменить», в поле «Найти» напишите ^p, в поле «Заменить на» напишите ^p^p^p, нажмите кнопку «Заменить все». Сохраните текстовый файл.

Выберите пункт главного меню «Файл | Сохранить как несколько аудиофайлов». В появившемся диалоговом окне выберите способ деления текста: Искать две пустые строки подряд. Всё, можно начинать запись аудиофайлов.

«Балаболка» является бесплатным программным продуктом, поэтому пользователь может использовать звуковые файлы, созданные приложением, по своему усмотрению. Но если применяется коммерческая версия компьютерного голоса, необходимо связаться с разработчиками этого голоса и приобрести специальную лицензию для его коммерческого использования. Такая лицензия позволит легально осуществлять распространение аудиоматериалов.

Фирмы, выпускающие компьютерные голоса, предоставляют два вида лицензий:

  • для индивидуального использования (for personal use);
  • для коммерческого использования и распространения аудиоматериалов
    (for commercial use/audio broadcast).

Если пользователь намерен использовать синтез речи в видео на YouTube или собирается включить звуковые файлы, созданные в программе «Балаболка», в состав своего программного продукта, необходимо приобрести у фирмы-изготовителя голоса соответствующую лицензию.

Например, вот что написано по этому поводу на сайте компании Cepstral: «Cepstral Personal voices are for personal use only and are NOT licensed for audio distribution. This means the audio you create is for your use only and cannot be shared with others or used in videos, presentations, or webpages. If you are interested in an audio distribution license, please contact sales.»

Нет, в «Балаболке» такая функция отсутствует. Для этого пришлось бы добавить в программу возможности видеоредактора: включить в состав программы кодек для сжатия видео (Xvid, DivX, x264 или другой). Есть другие способы получить то, что необходимо.

Ошибка синтезирования речи

+ Добавлена возможность использования интерфейса IFilter для извлечения текста.
+ Добавлен пункт главного меню «Проверить наличие обновлений».
+ Добавлена настройка «Проверять наличие обновлений при запуске программы».
— Исправлены мелкие ошибки.
* Обновлены болгарские, испанские, словенские и хорватские языковые ресурсы (спасибо
Костадину Колеву, Йожефу Грегорцу, Гордану Радичу и Fernando Gregoire).

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Есть текстовый документ.
Между предложениями слишком короткая пауза. Как настроить паузу нужной длинны ?
При озвучивании голосовым движком некоторые слова произносятся с неправильным ударением. Как исправить ударение в слове ?

Читать еще:  Ошибка при скачивании с торрента

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Обновлено 10 марта 2017:
Balabolka 2.11.0.622 + IVONA Tatyana 1.6.74 Portable
Содержит речевой синтезатор — Татьяна. Подключены PLS.
Размер: 218 МБ. Пароль: «ru-board»
https://yadi.sk/d/mnbsflHD3FS7KN

Balabolka 2.11.0.622 + IVONA Tatyana 1.6.75 Portable
Размер: 194,5 МБ.
https://yadi.sk/d/I9vRfQqj3FTAaF

Балаболка 2.11.0.624 & KMPlayer 2.9.4.1435 + Татьяна 1.6.75 Portable
Добавлен KMPlayer для озвучивания субтитров в кинолентах.
Размер: 210,2 МБ.
https://yadi.sk/d/exSeQJP83HFWLF

Balabolka 2.11.0.622 + IVONA Maxim 1.6.74 Portable
Размер: 237,7 МБ. Подключены PLS.
https://yadi.sk/d/_RFthqN13FbBwh

Balabolka 2.11.0.622 + IVONA Maxim 1.6.75 Portable
Размер: 211,9 МБ.
https://yadi.sk/d/KduGv2Sc3FUJFh

Можно использовать как отдельно, так и поместив ехе-шники в одну папку, Песочница у них будет общей, но не запускать в этом варианте более одного приложения одновременно.

Chech_buresh, в неё как понял тоже интегрированы словари?
Спасибо! Вы эту Portable делали? Если да, то нужна помощь, если нет, то кому переадресовать?
1. MiniSpeech при запуске просится в сеть, разрешать? Пока запрещаю, но записывать не даёт — кнопка не активна, только озвучивает текст.
2. Балаболка работает — озвучивает текст только при первом запуске. При повторном и далее после перезагрузок, запускается, но при нажатии кнопки плэй, чтобы она озвучила, или нажатии кнопки добавить текст, Балаболка сразу же вылетает. Пробовал удалять от неё папку, которую она создаёт. Это не помогает. В разных Windows, в 7, в XP перепробовал, везде отработала только один раз, больше никаким образом не хочет, всегда вылетает.
Подскажите, что делать и почему так происходит? Куда программа ещё информацию записывает? Ведь в первый запуск всё работало.

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Balabolka 2.11.0.620 + IVONA 1.6.75
B программу интегрированы русские голосовые модули — Tatyana и Maxim,
а также British english — Amy. Бонусом IVONA-вская Speech2Go, отличается от MiniSpeech возможностью записи в звуковой файл.

Чтобы добавить свои словари:
На Рабочем столе создать папку «Balabolka» и в ней папку «dictionaries».

Чтобы зазвучала англ. речь нужно в панели словарей снять галки с:
translit.dic
translit-to-cyr.dic

Послушал Milena — Premium High NEW! и русские голоса IVONA. IVONA на голову лучше читает, что мужским, что женским голосом, что в родных приложениях MiniSpeech и Speech2Go, что в Balabolka последней версии. Весьма существенная разница в качестве речи в пользу голосов IVONA.

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Balabolka 2.11.0.622 + IVONA 1.6.75 & Nuance. Комбайн™ Portable
(Maxim, Tatyana, Yuri, Katya, Milena, Amy)
Содержит русские голосовые модули — Максим, Татьяна, Юрий, Катя и Милена, а также British english — Amy. Speech2Go.

Размер: 1,46 ГБ. пароль ст.
После распаковки Размер: 1,70 ГБ.
https://yadi.sk/d/Po7vdXvn3EBZiX

Балаболка 2.11.0.622 + IVONA 1.6.74 Portable
Содержит русские голосовые модули — Максим и Татьяна, Speech2Go и TextAloud 3.0.103.
в Панели «Преобразование текста в речь» подключены словари PLS с сайта http://mytts.forum2x2.ru/. При подключении лексиконов наблюдается определенная задержка перед началом чтения текста.

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Балаболка 3-в-1 Portable. Другие иконки
Сборка содержит IVONA 1.6.75 русские голоса Татьяна и Максим и мелкобританскую нагличанку Amy. Также в составе Demagog и Speech2Go.
* Изменены иконки для Балаболки, которая имеется в двух вариантах — словари в «Документах» и словари в папке балаболки «на Рабочем столе».
* Изменено отображение названий голосов, дабы не было путаницы с голосами на реальной системе (если оные имеются)
* Настроены 9 профилей для вариантов от «Без словарей» и далее по нарастающей.
* Для пущего быстродействия не применялось сжатие, кроме папок словарей.

Размер: 505,2 МБ. пароль ст.
После распаковки Размер: 834 МБ.
https://yadi.sk/d/rqp462Sl3EjTFw

Балаболка + IVONA 1.6.74 и IVONA 1.6.75. 4-в-1
Сборка содержит IVONA 1.6.74 и IVONA 1.6.75 русские голоса Татьяна и Максим. Также в составе Demagog, Speech2Go и TextAloud 3.0.105.

Размер: 755,1 МБ. пароль ст.
После распаковки Размер: 1,21 ГБ.
https://yadi.sk/d/faX-XOFX3EviDZ

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Поставил свежую win7 64 оригинальную и начал заного проходить установку своих обычных программ с пошаговым запуском сборки 8-в-1, и при установке (старте) Punto Switcher 4.3.4.1753 elchupakabra (Portable) выскакивает ошибка запуска, запускается только от имени Администратора. При закрытии Punto Switcher’a — снова запускается в обычном режиме.

Ещё нашлось одно приложение, при котором не запускаются эти балаболки — Sticky Password 7.0.7.69 RePack by D!akov. При его выгрузке снова без проблем.

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Балаболка 2.11.0.624. Комбайн™ 9-в-1
Содержит 9 речевых синтезаторов: IVONAМаксим , Татьяна и British Amy . NuanceЮрий , Катя , Милена . AcapelaАлёна .
Максим и Татьяна в двух версиях — IVONA 1.6.74 и IVONA 1.6.75.
Также в составе Speech2Go, Demagog, Cool Reader-2, ICE Book Reader Professional Russian, Говорилка и TextAloud.
Добавлены Файловые Менеджеры на выбор: oMega Commander, Pablo Commander, XYplorer. Через их оболочку можно запускать в виртуальную файловую систему приложения, использующие в своей работе речевые синтезаторы: программы-читалки, браузеры и т.п. Например Firefox с таким плугином:
https://addons.mozilla.org/ru/firefox/addon/native-tts/
Добавлены PLShelper для IVONA 1.6.74 и Lexicon Manager для Acapela Алёны, каталогизаторы книг MyHomeLib и MultiLib

!Инструменты:

Размер: 2.1 ГБ. пароль ст.
После распаковки Размер: 2,50 ГБ.
https://yadi.sk/d/xaGbK_qz3GcPeE

Балаболка 2.11.0.624. Комбайн™ 9-в-1 с Файловыми Менеджерами
Всё то же самое, не применялось только сжатие, пущего якобы быстродействия ради.
Размер: 1,95/2,87 ГБ
https://yadi.sk/d/BW_R7bfd3Gagxv

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Поделитесь, пожалуйста, словарями, лексиконами, омографами и прочими соответствующими файлами для Татьяны! В официальном дистрибутиве Балаболки ничего этого нет.

Как в этой программе вручную корректировать омографы для Татьяны, если словари не справляются?

Комментарии 34

спасибо попробую если не получится попрошу совета

Обращайтесь, помогу, чем смогу.

Не понял как она на русском работает? Пишет ошибка синтезирования речи: OLE error 8004503A

Попробуте удалить программу и голосовой движок и переустановить.

Подобная проблема описана здесь:

но это для коммерческого голосового движка, а на сайте движок бесплатный,

есть кроме балаболки и ещё програмки подобные. если нужно кому, пишите, скину.

Есть еще как минимум «говорилка», только я разницы особой не ощутил, к тому же качество чтения, на мой взгляд зависит от голосового движка, а не от программы.

если уж на то пошло, то ещё ABoo, audiobook, reader TTS, bookmania, speecher, спикер, говорун, бормотуха, ice book reader rus и ToM Reader.

Да, разнообразие потрясает, только мне кажеться, что все зависит от голоса, а не от программы.

Просто редко пользуюсь такими программами, предпочитаю читать.

Дмитрий, в том, что всё зависит от голоса я с вами полностью согласен. просто привёл разннообразие для того, чтолб пользователи знали

подскажите, где это все можно найти — балаболка выдает ошибку.

Ольга, здравствуйте. вам сюда: http://zalil.ru/31410092

прежде чем давать программы попробусам с ними что либо сделать. не помню такого случая что бы что либо от сюда взял и оно работало.

1. Тыкать мне не надо, тем более судя по стилю написания комментариев, Вы младше меня.

2. Все программы на моем сайте 100% рабочие, проверяю всегда.

3. Врать не хорошо, мама не учила?

4. Скоро 1 сентября, готовьтесь, сходите учебники прикупите, таблицу умножения повторите, почитайте что-нибудь из классики, развивайтесь!

Программы может и рабочие,но вот ссылки.

комментарий на модерации

1. Деточка! Мы не в детском саду и *писунами* меряться не будем.

2. Я не говорил что все программы не рабочие. Вот ссылочки (см. ниже) действительно, того.

Читать еще:  Сортировка одномерного массива паскаль

4. А что такое первое сентября? . Будте так любезны, просветите нас сирых и убогих!

1. Я не собираюсь меряться с Вами ни чем. Когда человек переходит на такой тон как Вы — это значит, что у него нет аргументов.

«прежде чем давать программы попробусам с ними что либо сделать. не помню такого случая что бы что либо от сюда взял и оно работало.»

это значит, что Вы утверждаете, что програмы нерабочие, еще раз повторю, программы рабочие, Вы лжете.

4. Отличный сарказм! Бурные аплодисменты!

Вместо выяснения проблемы, Вы решили устроить соревнование в эпистолярном жанре?

Я у Вас пытаюсь выяснить суть проблемы, а Вы норовите меня оскорбить.

Ссылки все рабочие, я перепроверил, программу устанавливал у себя, (скриншоты делал лично), скажите, что не так?

Я приложу все силы, чтобы исправить ситуацию, только пожалуйста корректнее.

Здесь как в бане все равны. Не ндравиться тыкание вставь фото и автобиографию.

Вы знаете, я считаю, что обращение на Вы — это элементарное уважение к собеседнику, в принципе, даже если ему 12 лет.

Кстати, почему Вы ко мне на ты?

здравствуйте! желаю попробовать данную программу , где мне ее скачать спасибо

Можно скачать перейдя по ссылке внизу этой статьи,

а можно с официального сайта, как Вам больше нравиться.

1. Деточка! Мы не в детском саду и *писунами* меряться не будем.

2. Я не говорил что все программы не рабочие. Вот ссылочки (см. ниже) действительно, того.

4. А что такое первое сентября? . Будте так любезны, просветите нас сирых и убогих!

Простите глубоко уважаемый Господин,

«деточке» Всего 49 и я действительно имел ввиду ссылку на FOLDERICO

Ещё раз приношу извинения,

У Вас написано, что «для того, чтобы с помощью этой бесплатной программы прочитать книгу на русском языке необходимо вместе с программой скачать и установить так называемый речевой синтезатор». Вот под речевым синтезатором Вы, что имели в виду? И откуда его качать? Может Вы имели в виду вложенный RusEngineS5_22.msi, который тоже нужно запустить? И не совсем понятно, как по Вашей ссылке скачать Microsoft Agent, указанный в п.1 в конце статьи. Где его там искать на этой странице, которую Вы указали в ссылке

Необходимо нажать на ссылку вверху страницы «Просмотр и запрос на загрузку исправления» и действовать по инструкции.

Но это необходимо, если у Вас возникли проблемы с устновкой, у большинства устанавливается программа и без этих компонентов. У меня все установилось так, как написано в статье.

Речевой синтезатор, в данном случае то же самое, что и голос, как написано в статье он находиться в папке Oleg с архивом программы и называется, как Вы и написали RusEngineS5_22.msi.

Здесь сравнения разных речевых движков.

Несколько лет назад я установил Digalo.

Поскольку он мне понравился пришлось поискать крэк.

С тех пор работает нормально.

К сожалению этот движок не бесплатен, а данная группа (и мой сайт) только о бесплатных программах.

У меня, к сожалению, тоже не запускается Балаболка, выдает ошибку, хотя скачала и приложение голоса Олег. Балаболка его видит, но перевода не следует. В чем может быть причина?

Спасибо за науку. Замечательная программа. Несколько установленных дополнений исправили «OLE error 8004503A». Спотыкаемся на чём-то (закономерности пока не уловила), но читаем !

Часто встречающиеся ошибки при синтезе речи

Часто встречающиеся ошибки при синтезе речи:

Ошибка синтезирования речи:
OLE error 80045001

для устранения ошибки запустите и импортируйте файл реестра:

speech.reg

Ошибка синтезирования речи:
FATAL ERROR IN FILE:MyCvsressynthselection_pagelsrcselector_engine.cpp LINE:166
NO BEST PATH BETWEEN UNITS 4 AND 5FATAL ERROR IN FILE:MyCvsressynthselection_pagelsrcselector_engine.cpp LINE:166
NO BEST PATH BETWEEN UNITS 4 AND 5

Ajaja пишет: Есть такая проблема у Алены. Лечится поиском слова или словосочетания в тексте, на котором программа валится, и добавлением его в словарь (в Lexicon Manager).
balabolka пишет: Это ошибка в движке голоса «Alyona». Попробуйте добавить проблемное слово или словосочетание в «Lexicon Manager», который входит в состав голоса. Также, рекомендуется загрузить и установить самую последнюю версию голоса с сайта «Acapela Group».
Ошибка синтезирования речи:
OLE error 80045001
OLE error 80045007
OLE error 80045005
OLE error 8004503A

Проверьте доступна (работает) ли ваша звуковая карта, воспроизводится ли звук на компьютере и видна ли в диспетчере задач. Если нет, переустановите устройство драйвер.

Если ошибка осталась, зайдите в Панель управленияРечьАудио выход и укажите вручную вывод звука на вашу карту:

Для TextAloud — OptionsSelect audio device:

Ошибка синтезирования речи:
Floating point division by zero

Ошибка синтезирования речи:
OLE error 80045042

Утилита для восстановления SAPI 5 ключей реестра
Автор: www.tiflocomp.ru

В процессе установки или удаления (деинсталляции) некоторых SAPI5-голосов в системном реестре Windows могут произойти изменения, которые приводят к неработоспособности других SAPI5-голосов. Для исправления подобных ошибок компания NextUp Technologies предложила утилиту, которая проверяет целостность определенных ключей системного реестра и, в случае необходимости, восстанавливает их.

Загрузить утилиту можно по этой ссылке (zip, 327 Кб). Если данная ссылка уже не действует, то воспользуйтесь вариантом загрузки с нашего сайта.

Программа не требует установки: достаточно распаковать архив и запустить exe-файл. Англоязычный интерфейс программы незатейлив. Для проверки целостности ключей реестра следует нажать кнопку «Check». Если программа обнаружит ошибки, то для их исправления следует нажать кнопку «Repair». Чтобы выйти из программы, необходимо нажать кнопку «Exit».
Перечень ошибок Microsoft Speech API (SAPI)
Спойлер:

* MyTTS

Форум о преобразовании текста в речь

Регистрация через социальные сети

Балаболка TTS

Модератор: balabolka

  • Перейти на страницу:

Балаболка TTS

Сообщение evmir_troll-hunter » 22 июн 2018 20:03

Илья Морозов

Установочная версия
Portable-версия

Программа «Балаболка» предназначена для чтения вслух текстовых файлов. Для воспроизведения звуков человеческого голоса могут использоваться любые речевые синтезаторы, установленные на компьютере. Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в каждой мультимедийной программе («воспроизвести», «пауза», «стоп»).

Программа умеет читать вслух содержимое буфера обмена, показывать текст, содержащийся в документах, изменять настройки шрифта и цвета, управлять процессом чтения из системного трея (области уведомлений) или при помощи глобальных сочетаний клавиш, произносить набираемый на клавиатуре текст, проверять орфографию, делить текстовый файл на несколько файлов меньшего размера, искать омографы.

«Балаболка» умеет извлекать текст из электронных документов. Поддерживаются форматы файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, HTML, LIT, MOBI, ODS, ODT, PDB, PDF, PRC, RTF, TCR, WPD, XLS, XLSX.

Текст может быть сохранен в виде аудиофайла (поддерживаются форматы WAV, MP3, MP4, OGG и WMA). Программа умеет работать с различными версиями пакета речевых функций Microsoft Speech API (SAPI). Он позволяет изменять скорость и тембр речи.

Программа может сохранять текст, читаемый компьютерным голосом, в файлах форматов LRC и SRT, а также в тегах ID3 внутри звуковых файлов формата MP3. При воспроизведении такого звукового файла в медиаплеере текст отображается синхронно (так же, как тексты песен в музыкальных файлах).

Re: Общая тема

Сообщение Fenix » 28 июн 2018 06:50

tonio_k писал(а): Nov 24 2017

Вопросы:

  1. В какой последовательности идёт замена по списку файлов словарей (кто раньше) REX или DIC?
  2. В какой последовательности идёт обработка файлов словарей REX между собой — по алфовиту?
  3. В какой последовательности идёт обработка файлов словарей DIC между собой — по алфовиту?
  4. В какой последовательности идёт оброка строк правил внутри самого словаря? (REX / DIC) с первой строки и далее вниз?
  5. Какие словари по производительности быстрее работают? Какому отдать предпочтение для скорости обработки текста REX или DIC ?
  6. Если отсортировать правила внутри словаря по алфовиту или по длине строки или ещё по какому признаку это как то влияет на ускорение процесса обработки словаря (REX / DIC)
  7. Большой размер файла DIC. Может его лучше разбить на несколько небольших? или можно смело объединять в один файл? Или нет разницы и на производительность не влияет?
Читать еще:  Код ошибки 70

Файлы PLS — это файлы для голосов от фирмы IVONA. «Балаболка» с этими файлами не работает.

Спецификация PLS (Pronunciation Lexicon Specification) была разработана консорциумом W3C как стандарт словарей для распознавания речи и для синтеза речи. Эти словари определяют транскрипции (произношения) слов для применения в компьютерных голосах. Теоретически для разных речевых движков можно создавать свои словари формата PLS, но только голоса IVONA позволяют пользователям легко и просто подключать свои словари (с помощью панели управления голосами IVONA в панели управления Windows). Формат PLS — это только рекомендация от консорциума W3C, так что разработчики компьютерных голосов не обязаны его использовать.

Re: Общая тема

Сообщение evmir_troll-hunter » 28 июн 2018 07:24

4) начинаете запись. При этом последний файл (33.mp3) будет перезаписан

После записи не забудьте «обнулить» эти поля. В противном случаем следующая книга начнется с 33 файла и с озвучкой 33 блока.

Для того, чтобы озвучивать субтитры разными голосами, необходимо использовать тег SAPI для смены голоса . Подробнее о теге можно прочесть в файле справки «Балаболки».

Субтитры будут выглядеть следующим образом (субтитры формата SRT):

balaam-hellman писал(а): Хотел уточнить информацию по регулярным выражениям.

Так как формат записи выражений в словарь «regexp»=»замена», то конструкция позитивный просмотр вперёд/назад нарушает выражение в файле, из-за дополнительного знака равенства. например:
(?=bпропахw+s+|bпропитw+s+)потомb=пОтом.
Можно как-то «экранировать» такое выражение, чтобы оно не нарушалось?

P.S. некоторые библиотеки не поддерживают квантификаторы, только конкретное неизменяемое выражение c альтернацией «|».

balaam-hellman писал(а): Благодарю за ответ, но я, наверное, не совсем правильно выразился. Мне нужно экранировать знак равно от разбивания в словаре, а не для того, чтобы он воспринимался как символ.

Разъясню свою мысль на примере:
Тестовая фраза: «Это прсто здесь»
Регекс: (? Понял, спасибо за пояснение. Нет, формат словарей для регулярных выражений таков, что выражения с символами (?=) использовать нельзя. Не вижу способа обойти ограничение.

Собственно, файлы *.REX нельзя назвать настоящим «форматом» словаря. Просто давным-давно немецкие пользователи «Балаболки» прислали список регулярных выражений, который использовался в старой программе для чтения вслух (кажется, голландской, для SAPI 4). Обычный текстовый файл, на каждой строке по одному регулярному выражению для замены. Пользователи попросили, я добавил поддержку этого файла в свою программу, взяв старый словарь как есть. В результате мы сейчас имеем, что имеем.

Re: Общая тема

Сообщение Fenix » 28 июн 2018 07:52

balabolka писал(а): В словарях формата BXD для каждого правила должен быть задан его тип: обычная замена текста (как было в словарях DIC) или регулярное выражение (как в REX). Текст, которым будет заменен шаблон, может представлять собой набор фонем.

Правила применяются последовательно, одно за другим. Каждое правило можно отключить/включить. Для каждого правила можно задать описание (комментарий).

Для удобства редактирования рекомендуется использовать фильтр (пункт меню «Вид|Показать фильтр»). С его помощью можно быстро найти нужное правило.

От форматов DIC и REX постепенно буду отказываться. Не скоро, но их поддержка будет удалена из программы. Преобразовать словари из DIC/REX в BXD можно двумя способами:

  • щелкнуть правой кнопкой мыши на имени словаря в панели словарей и выбрать пункт контекстного меню «Переименовать»; после переименования в файл с расширением *.bxd программа преобразует данные в словаре;
  • создать новый словарь, открыть в редакторе и выбрать пункт меню «Файл|Вставить из файла».

tonio_k писал(а): Apr 16 2018

Может добавить возможность разбивать текст на отрезки определенного размера, НО по абзацам? Это может понравится тем, кто слушает книги на плеере с озвучкой блоков. Тогда каждый номер блока будет означать, что основная мысль только что была озвучена, и с нового блока начинается следующее событие с нового абзаца, а не «разрывать» текущую мысль между несколькими предложениями, относящимся к одному абзацу.

balabolka писал(а): Когда программа делит текст на части определенного размера, она находит позицию в тексте, кратную размеру килобайта, а затем проверяет ближайшую 1000 символов. Если в пределах этого диапазона есть граница абзаца, она становится границей части текста. Если границы абзаца нет, концом части текста становится окончание ближайшего предложения.

Можно попробовать распознавать границу абзаца более точно или увеличить диапазон, но сам принцип деления текста на части останется прежним.

Спасибо за словари.

Какого-либо замедления в обработке словарей DIC и REX не обнаружил. Сравнивал с версией 2.11. Проверил программный код, там также нет серьезных изменений в применении правил DIC и REX. Замедление произошло по каким-то другим причинам.


Есть проблема с преобразованием словарей DIC в формат BXD. Сейчас программа переносит правила как есть, в том порядке, в котором они хранятся в файле DIC. Но применялись правила из словарей DIC не так: правила из разных словарей объединялись в единый список, а затем выполнялась сортировка по длине шаблона.

Поэтому в следующей версии программы при преобразовании DIC в BXD правила из файла будут отсортированы перед вставкой в новый словарь.

Но проблема всё равно останется, если есть несколько словарей DIC. Рекомендуется сначала объединить все словари DIC в один словарь DIC и только затем преобразовать его в BXD. Так сохранится «оригинальный» порядок применения правил. (Подумаю над тем, чтобы выбирать сразу несколько файлов при вставке правил из файла.)

В «Балаболке» не задан модификатор m для регулярных выражений. Поэтому текст обрабатывается как одна строка, а не как несколько строк.

m (PCRE_MULTILINE)

По умолчанию PCRE обрабатывает данные как однострочную символьную строку (даже если она содержит несколько разделителей строк). Метасимвол начала строки ‘^’ соответствует только началу обрабатываемого текста, в то время как метасимвол «конец строки» ‘$’ соответствует концу текста, либо позиции перед завершающим текст переводом строки (в случае, если модификатор D не установлен). . В случае, если обрабатываемый текст не содержит символов перевода строки, либо шаблон не содержит метасимволов ‘^’ или ‘$’, данный модификатор не имеет никакого эффекта.

Модификатор не задан внутри программы «Балаболка».

Не то, чтобы я был принципиальным противником применения этого модификатора. Просто по умолчанию ни один из модификаторов не используется. Раз никого из пользователей это не волновало, то не стал ничего менять.

Возможно, стоит использовать модификатор m, судя по правилам в существующих словарях.
Непосредственно в тексте правила модификатор включается/выключается таким образом:

Конфликта не будет. И не забывайте выключать модификатор при помощи (?-m).

Скорее всего, буду использовать этот модификатор по умолчанию в следующей версии программы. Спасибо, что обратили мое внимание на эту проблему.

Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector
×
×