Логотип Автор24реферат
Задать вопрос
Реферат на тему: Информационные системы в медиаиндустрии, системы машинного перевода
100%
Уникальность
Аа
13515 символов
Категория
Информационные технологии
Реферат

Информационные системы в медиаиндустрии, системы машинного перевода

Информационные системы в медиаиндустрии, системы машинного перевода .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

ВВЕДЕНИЕ
21 век – это век новаций, новаторства, информационного скачка в развитии, когда именно информационные технологии «идут» быстрее всех. Наряду с развитием новых тенденции в виде блогерства и стримов, остро встает вопрос о переводе «live-каналов» в реальном времени, т.к. интернет объединяет людей, когда преграда в тысячи километров не играет уже никакой роли.
К великому сожалению ни каждый обладает даже средним уровнем знания, того или иного языка. К большому огорчению умение, уровень и адаптивность машинного перевода оставляет желать лучшего, зачастую это результат набора слов или отсутствие подобающей стилистики. Но не смотря на подобные «баги», каждый из нас прибегал к услугам машинного перевода, да перевод «кривой», пусть бессмысленный, но результат присутствует: слова ведь переведены и о смысле или характере текста уже можно догадаться.
Цель моей работы это немного рассказать об истории происхождения машинного перевода в информационных системах, рассказать о типах и их особенностях, ну и самое главное – затронуть его «больные» и слабые зоны.
Но забегая вперед, могу сказать, что нет каких-то идеалов или идеальных программ, информационные системы штука очень интересная, это как приложения на Android-е, требует постоянного контроля и обновления, ведь информационные системы никогда не стоят на месте, каждый день, каждый час вносятся какие-то обновления, начиная от адаптивности и заканчивая критическими ошибками.
ИНФОРМАЦИОННЫЕ СИСТЕМЫ В МЕДИАНДУСТРИИ И СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
ИСТОРИЯ МАШИННОГО ПЕРЕВОДА
Сама идея и задумка машинного перевода была «рождена» еще в далеком 1947 г., но тогда эта задача носила иной характер. Идеей была дешифровка данных, это была обнаружено и обнародовано в письме специалиста по криптографии Уоррена Уивера.
Первая же работающая система по переводу с русского на английский была представлена в далеком 1954 г. и носила название IBM MARK II. Пусть она была примитивной и узкой, но начало было положено, ведь как правило начать всегда сложнее всего.
МАШИННЫЙ ПЕРЕВОД
«Переводом называется процесс преобразования речевого произведения на одном языке в речевое произведение на другом языке при сохранении неизменного плана содержания, то есть значения»[Бархударов, 1975, с.10].
«Перевод - это сложный и многогранный вид человеческой деятельности» [Комиссаров, 1990, с.10].
Смысл слова перевод можно трактовать по разному и глубина его многогранна и многоопциональна, но суть - это преобразование слов, предложений и выражений без потери смысла на понятный нам язык.
Существует три вида алгоритмов преобразования текста машинного перевода:
- rule-based (основанный на правилах), его используют многие разработчики систем машинного перевода, такие как ПРОМТ в России;
- statistical-based (основанный на статистике), его обширное распространение в такой нише как YANDEX, GOOGLE-переводчик и т.д;
- гибридные, являются наиболее перспективными, т.к. в него пытаются внедрить сильные стороны предыдущих двух видов.
RULE-BASED
Rule-based – машинный перевод на основе правил, по другому, это перевод на основе лингвистической информации об исходном и переводном языке. Данный вид принято считать классическим. Принцип его прост – связь структура входного и выходного предложения перед компьютерной машиной. У этого вида существует три группы:
Системы пословного перевода;
TRANSFER – преобразование структуры входного языка в грамматические конструкции выходного языка;
INTERLINGUA – промежуточный язык описания смысла.
Главным достоинством систем на основе трансфера – минимальный уровень затрат на первичную разработку и модернизацию, а также высокая полнота охвата текстов.
А теперь рассмотрим «плюсы» и «минусы» и перейдем к следующему виду

Зарегистрируйся, чтобы продолжить изучение работы

. Что входит в «плюсы»:
- синтаксическая и морфологическая тонность;
- возможность настройки на предметную область;
- стабильность и предсказуемость результата.
А «минусы» это:
- трудоемкость и длительность разработки;
- «машинный акцент» при переводе;
- необходимость обновления базы-данных.
СИНХРОННЫЙ АВТОМАТИЧЕСКИЙ ПЕРЕВОД
Что подразумевает в себе синхронный автоматический перевод? Speech-to-SpeechReal-TimeTranslation - «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
В отличие от печатного текста или искусственных сигналов, естественная речь не допускает простого и однозначного членения на элементы (фонемы, слова, фразы), поскольку они не имеют явных физических границ. Границы слов в потоке речи автоматически могут быть определены лишь в ходе распознавания посредством подбора оптимальной последовательности слов, наилучшим образом согласующейся с входным потоком речи по акустическим, лингвистическим, семантическим и иным критериям.
Процесс электронного перевода речи (S2S Real-TimeTranslation), как правило, включает следующие три этапа):
- автоматическое распознавание речи (ASR — automaticspeechrecognition) — преобразование речи в текст;
- машинный перевод (MAT — Machine-AssistedTranslation); — автоматический перевод текста с одного языка на другой.
- синтез речи (TTS — text-to-speech) — технология, которая даёт возможность произнести текст голосом, приближенным к естественному.
Говорящий на языке A говорит в микрофон, а модуль распознавания речи признаёт произнесённое. Происходит сравнение входных данных с фонологическими моделями, состоящими из большого количества речевых библиотек. Отфильтрованное таким образом, используя словарь и грамматику языка А, преобразуется в строку слов, основанную на массиве фразы языка А. Модуль автоматического перевода преобразует эту строку. Ранние системы, заменяли каждое слово, с соответствующим словом в языке B. Более совершенные системы, не используют дословный перевод, а принимают во внимание весь контекст фразы, чтобы произвести соответствующий перевод. Созданный перевод передаётся в модуль синтеза речи, который оценивает произношение и интонацию, соответствующую ряду слов из массива речевых данных языка B. Данные, соответствующие фразе, отбираются, соединяются и выводятся в необходимой потребителю форме на языке В.
Помимо проблем, связанных с переводом текста, синхронный перевод речи имеет дело с особыми проблемами, включая бессвязность разговорного языка, меньше ограничений грамматики разговорного языка, неясной границы слова разговорного языка и коррекции ошибок распознавания речи. Кроме того, у синхронного перевода есть свои преимущества по сравнению с переводом текста, в том числе менее сложную структуру разговорного языка и меньше лексики в разговорном языке.
По мере роста мощностей аппаратных устройств, можно ожидать появления машинных переводчиков c меньшим количеством ошибок в переводе, что является главной проблемой всех электронных переводчиков речи

50% реферата недоступно для прочтения

Закажи написание реферата по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥

Магазин работ

Посмотреть все
Посмотреть все
Больше рефератов по информационным технологиям:

Технология cuda. Сущность. Возможности

25545 символов
Информационные технологии
Реферат
Уникальность

Развитие электронного (дистанционного) обучения в Южной Корее

13967 символов
Информационные технологии
Реферат
Уникальность

Файлы и каталоги

8097 символов
Информационные технологии
Реферат
Уникальность
Все Рефераты по информационным технологиям
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты