Тифлострим, № 38. Яблочная доступность, обновление JAWS и картинки словами

Текстовая версия

— Линейка iPhone 11: привлекает? Или кусается?

— iOS 13: что нового в доступности для незрячих?

— JAWS 2020: чем порадует очередная версия?

— Распознавание фотографий: Vision Bot спешит на помощь

— Текстовые мемы, или При чём тут Карл?

Всё это — в новом «Тифлостриме».

Участники: автор сервиса Vision Bot Алексей Самойлов и один из администраторов паблика «Текстовые мемы» Данила Жигайло

Ведущие: Ольга Монако, Олег Шевкун

Дата выпуска: 16.09.2019

«Тифлострим». Не только для незрячих

Ссылки по теме:

Сервис Vision Bot: https://visionbot.ru/index.php?ts

Паблик Vision Bot в ВК: https://vk.com/visiontest1

Паблик Текстовые мемы в ВК: https://vk.com/textmeme

 

Олег ШЕВКУН: Это мы. Привет всем! Ольга Монако письма читает, на вопросы отвечает. Оля, привет!

Ольга МОНАКО: Это я могу, да. Всем привет!

О. ШЕВКУН: Можешь, да. А что, уже пишут, спрашивают, «Привет!» говорят?

О. МОНАКО: Приветствуют нас уже Максим и Руслан, и ответный вам привет. Мы рады, что вы с нами!

О. ШЕВКУН: Оля вам рукой помахала. Такой тифлокомментарий сразу даю. Сегодня у нас с вами интересный, по крайней мере, я думаю, что интересный, и очень стремительный эфир. Мы будем читать ваши сообщения обязательно, но я понимаю, что прочитаем не всё. У нас в среду будет эфир, где мы специально уделим время именно вашим сообщениям, но сегодня пишите тоже, потому что сегодня будем говорить и про iOS 13, и про новую линейку iPhone от компании Apple, и других устройств Apple, конечно. Будем говорить немного про JAWS 2020, настолько, насколько пока можем говорить. И будем говорить про две интересные инициативы – современные, новые инициативы, которые касаются, во-первых, фотографий на слух, рассказа о том, что на фотографиях, и автоматического определения содержания фотографий. И, во-вторых, будем говорить про мемы.

Слушай, Оль, ты мне скажи, у меня есть один знакомый. Он любит слово “мемасы” или “мемасики”. Это только его слово или нет?

О. МОНАКО: Нет, это очень распространённое слово, хотя и противное.

О. ШЕВКУН: Я думал, что мне противно в силу возраста, а оказывается есть ещё люди, кому это противно.

О. МОНАКО: Оно просто противное.

О. ШЕВКУН: Друзья, пишите ваши вопросы, пишите ваши комментарии! Если нет интересных комментариев, которые Оля хочет прочесть, идём дальше к следующей теме.

О. МОНАКО: Ну, с нами пока только здороваются. Вот, к нам присоединились: Елена, Фантомас, Ксения.

О. ШЕВКУН: Идём дальше. Ты у нас айфонный человек?

О. МОНАКО: Да, полностью.

О. ШЕВКУН: Какой из новых iPhone ты заказываешь? iPhone 11, iPhone 11 Pro или iPhone 11 Pro Max?

О. МОНАКО: Никакой.

О. ШЕВКУН: Что так? Не нравятся?

О. МОНАКО: Ну, камеры у них смешные. Но вообще денег нет.

О. ШЕВКУН: По три камеры, между прочем, у «Прошки» и у «Про Макса». Вернее, тройная камера. Плюс ещё камера для селфиков. Но она тоже хорошая. У неё, вроде, семь Мегапикселей расширение. 3 камеры, 120 градусов обзора. Ты представляешь, Оля, говорят, практически профессиональная стабилизация. Что, 100 тыс. нету, Оля?

О. МОНАКО: Ну, вот, что-то нету. Потратила последнее. Буквально на днях, за несколько дней до выхода нового iPhone. Не рассчитала.

О. ШЕВКУН: А я хочу услышать вас, друзья. Кто из вас собирается обновляться на iPhone 11, несмотря на те цены, которые начинаются с 80 тыс. и дальше? Ну, не в небеса, конечно, но почти. Потому что «фишки»-то там действительно интересные. Кстати, мне нравится, что наконец это всё-таки опять с номерами. А то было же iPhone X, iPhone X с буковками. Вот, соответственно, XR – это теперь Pro, а XS – это теперь Pro Max. Хотя букв стало больше, но и цифры вернулись.

Кто собирается обновляться? Пишите нам, пожалуйста, и о том, почему вы собираетесь обновляться? Кто не собирается обновляться, тоже напишите, почему вы не собираетесь обновляться.

Кстати, я хотел бы обновиться вот почему: угол обзора – 120 градусов, улучшенное качество камеры. Это здорово, в частности, когда нужно снимать видео, особенно, когда ты не очень видишь, что снимаешь. Ты наверняка больше захватишь. Это нужно для приложений, которые обеспечивают помощь. То есть, например, незрячий человек показывает то, что видит его камера, зрячему помощнику, и он получает больше обзор. Знаете, как со старыми бывает: ты показываешь, а тебе говорят: немного направо, немного налево. А тут 120 градусов! Всё-таки неплохо. Дальше, ускоренная работа. Конечно, это всё впечатляет. Честно говоря, было бы у меня лишних 100 тыс., я бы, наверное, обновился.

Кстати, десять лет назад, в 2009 году, по-моему, в июле, вышел iPhone 3GS. Тебе, скорее всего, этот факт ничего не скажет. 3GS – какая-то древность. Но нашим слушателям он о многом скажет. Это первый iPhone, который был доступен незрячим и слабовидящим людям. Это первый iPhone, который разговаривал. Это первый iPhone, который дал возможность использовать нормально и удобно сенсорный экран. Так что, десятилетие iPhone уже прошло. Пару лет назад это было. А вот десятилетие доступности iPhone – оно прямо сейчас, оно на наших глазах.

И вот iOS 13. Даже для тех, кто не собирается или не может по каким-то очевидным причинам в ближайшее время обновляться, iOS 13 – это замечательный апгрейд, замечательное обновление как раз в плане доступности. Бесплатное, удобное, и про iOS 13 все говорят, многое говорят. Сегодня я хочу просто показать некоторые новые возможности доступности, которые мне кажутся наиболее интересными, наиболее яркими. Это касается iPhone, это касается iPad. Там своя операционная система теперь, но эти возможности также есть. Так вот, в рекламе и во всех обзорах новой iOS пишут о том, что эта система работает даже на таких старых устройствах, как iPhone 6 или, внимание, iPhone SE.

О. МОНАКО: Слушай, Олег, тут наши слушатели уже нас сейчас начнут бить, потому что они уже к вопросу об обновлениях пишут о том, что у большинства из них iPhone SE. Он их очень устраивает, и в силу функционала, и размера. Несколько человек отметили. И пока он работает, будет работать, и они будут им пользоваться.

О. ШЕВКУН: Абсолютно так. Я не хочу кирпич в кармане, совершенно верно. Но понимаешь, Оль, как только мы с тобой это скажем, найдутся другие слушатели, которые скажут: «Ретрограды! Не хотите обновляться! Хотя бы до восьмёрочки бы обновились!» Я честно могу сказать: «Слушайте, я на экран практически не смотрю. Маленький телефон я положил в карман, и он совершенно нормально там работает». Так что, мы с тобой – братья по iPhone.

Вот, теперь, что касается обновлений: кстати, друзья, кто уже поставил? Потому что можно было поставить бета-версию iOS 13. Буквально через несколько дней выйдет и конечная версия iOS 13. Те, кто поставили бету, сейчас тестируют iOS 13.1. И, слушайте, друзья, я не знаю, как вы, а я в восторге от тех возможностей, которые это обновление даёт. Потому что, во-первых, даже мой старый телефон работает существенно шустрее. Приложения гораздо быстрее, гораздо лучше открываются, и мне это нравится. Есть, правда, приложения, которые глючат, но я думаю, что их достаточно быстро обновят. То есть, первая для меня важная вещь: расскажите, кстати, что важно для вас, но первое, что важно для меня – это как раз ускорение работы приложений. Вторая история: многие говорят про голосовое управление устройством, когда вы можете сказать устройству типа: «следующая страница», «предыдущая страница», «смахнуть вправо», «смахнуть влево» и т.д. Кому-то это, наверное, полезно. В частности, это полезно людям, у которых проблемы с руками, и это может быть очень и очень важно.

Но для меня лично оказалось это не столь важно. Для меня важно, например, что теперь iPhone, даже мой старенький iPhone, понимает диктовку. То есть, я могу диктовать ему на любом из установленных на него языков. Там до четырех языков можно установить. В моём случае у меня стоят русский и английский. И я могу писать, допустим: “Thank you, I’ll call you right back.” или “Спасибо, перезвоню, как только будет возможность». И он правильно понимает, на каком языке я говорю. Но понимаешь, тут сразу такая «фишка», когда думаешь: ну, всё здорово, но вот ещё бы… Знаешь, чего я теперь хочу? Я теперь хочу, чтобы он мог понимать русский текст с английскими вставками. Ну, например, я хочу иметь возможность сказать: последние устройства iPhone и iPad от компании Apple можно купить в магазине в New York. И чтобы это нормально распознавалось. Ну, то есть, понимаешь, что ни сделай, всё равно найдутся люди, которые скажут: «А я хочу ещё!». Но вот эта диктовка мне, конечно, очень и очень помогает.

Пишут что-нибудь, нет?

О. МОНАКО: Да, обсуждаем активно. Пошёл вопрос по поводу размера, прежде всего, iPhone. Ну, вот, после SE начали выходить «лопаты», как все любят выражаться.

О. ШЕВКУН: А некоторым удобно. Кстати, среди наших слушателей есть люди, которым это удобно? Я думаю, что есть.

О. МОНАКО: Да, есть. Ксения пишет: “Люблю большие телефоны. У меня пальцы длинные”.

О. ШЕВКУН: Ещё одна вещь, которая мне понравилась – это то, что теперь “Универсальный доступ” находится в основном меню настроек. То есть, не надо заходить в подменю. Сразу заходишь в настройки, и в настройках достаточно легко попадаешь в “Универсальный доступ”. Кстати, к этому нужно привыкнуть, потому что я постоянно заходил в “Основные” сначала, искал там, а там его нет, потом вспоминал, что его там уже нет. Это полезная штука. Дальше: полезная мелочь, которая мою жизнь облегчила существенно. Это полоса прокрутки. Для зрячего человека это не очень понятно. Для нас с вами это очень понятно. Когда есть, например, какой-то многостраничный текст или даже многостраничное меню, есть, конечно, команды (эти движения тремя пальцами вверх или вниз), которые позволяют перемещаться по странице, но, во-первых, это не очень удобные команды, а во-вторых, по странице, особенно в длинном документе, это сложно сделать. Так вот, я просто ставлю палец на правую часть экрана (куда угодно на правую часть экрана) и слышу “вертикальная полоса прокрутки”. И я одним пальцем смахиваю вверх или вниз и слышу: “0 %”, “10 %”, “20 %”, “30 %”, “40 %”, “50 %” и т. д. Причём так прокручивается любой документ, любая страница. И дальше уже, найдя часть, которая нам нужна, мы делаем всё остальное. Мы разбираемся с тем, что там есть. Мелочь, но настолько приятная мелочь!

О. МОНАКО: Мелочь, а приятно. Пока никто из наших слушателей не планирует обновляться на новый iPhone, а вот насчёт iOS 13 – да, привлекает многих. В том числе «тёмной темой».

О. ШЕВКУН: «Тёмная тема», да, нам об этом писали даже в ВК в нашем сообществе, пока мы готовились к этому эфиру. Опять-таки аналог этому, в принципе, можно было сделать. Можно было настроить цвета экрана, можно было что-то такое смастерить. Но «тёмную тему», во-первых, не нужно мастерить. Она сделана уже. Она сделана очень неплохо. Она поддерживается во многих приложениях. И слабовидящим людям это оказалось очень-очень удобно. Ещё одна вещь: я не знаю, сколько пользовался iPhone, я её не находил. Я её нашёл только в iOS 13. Я её не видел в обзорах. Может быть, не читал правильных обзоров, но это вещь, которая меняет во многом мой способ работы с телефоном. Это контекстное меню. Причём эти контекстные меню существуют во многих местах. Ну, например, я на основном экране. И на часах я смахиваю одним пальцем вверх, и получаю этот замечательный пункт, который есть во многих местах, как я уже сказал, – “Показать контекстное меню”. Я открываю его и вижу здесь следующие пункты: «Создать будильник», «Запустить секундомер», «Изменить порядок приложений». То есть я могу не открывать часы для того, чтобы запустить секундомер или создать будильник. Причём этот контекст бывает разным. Например, App Store. Находим его, смахиваем пальцем вверх. Обратите внимание, «Поиск», «Выкупить сертификат», допустим, «Обновления», «Список покупок» – оно всё прямо здесь, в контекстном меню. Кстати, если вы просто откроете App Store в iOS 13 и вы будете искать там «Обновления» (раньше это была отдельная вкладка), вы сейчас эту вкладку там не найдёте. Она в других местах. В частности, она находится вот здесь.

В почте, в сообщениях, в других приложениях попробуйте этот жест – палец вверх, ну, или несколько раз пальцем вниз. Просто поищите, поизучайте. Например, в приложении “Погода” вы найдёте те места, в которых вы чаще всего бываете. В контекстное меню попадает то, что авторы приложений хотят туда поместить. Контекстное меню есть и у элементов приложений. Но опять-таки, я думаю, эта очень простая функция окажется полезной многим.

О. МОНАКО: Слушателей очень интересует вопрос, как работает функция прокрутки в Telegram, например?

О. ШЕВКУН: Мы можем это проверить.

О. МОНАКО: А по поводу контекстного меню говорят, что это было и раньше на 3D Touch.

О. ШЕВКУН: С 3D Touch, кстати, интересная история. Ведь в iPhone 11 3D Touch нет. Как они его раскручивали! Как они нам объясняли, какой это грандиозный прорыв, как это здорово и как мы все будем рады по поводу этого 3D Touch! Ну и что? Прошло несколько лет. Новый экран, и этот новый экран 3D Touch не поддерживает, и – до свидания, 3D Touch! Мне было обидно в своё время, что у меня нет телефона с 3D Touch, а теперь уже не обижаюсь. Было и прошло.

О. МОНАКО: Кстати, по поводу распознавания слов пишут, что работает распознавание английских, например, слов при русском наборе.

О. ШЕВКУН: Вот мне почему-то этого не удавалось. Может быть, какие-то отдельные слова.

О. МОНАКО: И причём это работает ещё с версии 12.4.

О. ШЕВКУН: Вот не знаю. Раз пишут, значит работает. Почему мы здесь и обсуждаем. Тут не эксперты собрались. Я просто делюсь тем, что на меня произвело впечатление. Значит, в Telegram полосы прокрутки нет. Как она работает, не знаю.

О. МОНАКО: Как нет, так и работает.

О. ШЕВКУН: Так что, Telegram ещё надо доделать.

Вот, дальше. Ещё одна интересная фишка iOS 13 – это возможность переназначения команд. То есть, грубо говоря, команды VoiceOver вы можете переназначить, как вам удобно. Ну, не нравится вам это смахивание тремя пальцами вверх или вниз, переназначьте его на что-то такое, что уже есть. Может, даже закреплено на другой команде, но вы этим не пользуетесь. Есть там совершенно дикие команды, когда вы включаете и увеличитель, и VoiceOver. Например, команда пятикратного касания. Не нравится вам пятикратное касание. Мне тоже не нравилось бы пятикратное касание. Вы заходите и переназначаете так, как вам надо. Это блестяще совершенно. Это давно нужно было сделать. На компьютерах это есть давно. Здесь сейчас это тоже появляется. Причём это касается и клавиатурных команд, и команд брайлевского дисплея, и команд различных касаний экрана.

Дальше, ещё одна вещь, которую можно сделать, – это создать действие. Например, я расскажу, где это можно использовать. Вы можете сделать так, чтобы в определённых приложениях у вас были определённые настройки. Вы создаёте новое действие, в этом новом действии вы определяете, какие будут настройки, как это должно выглядеть, и указываете, в каком приложении это действие должно автоматически выполняться. Например, вы изучаете иностранный язык, и вам надо, чтобы, когда вы открываете какое-нибудь приложение, допустим, Duolingo, у вас речь была медленнее. Соответственно, вы делаете такие настройки, выстраиваете речь. Причём вы можете настроить и многословность, какие знаки препинания читать, какие не читать. В iOS 13 – вплоть до конкретных знаков препинания, так, как вам это надо. Потом всё это сохранить как действие и назначить это действие на условия открытия определённого приложения. И вот вы открываете ту же самую Duolingo, и у вас автоматически начинают работать те настройки, которые для этого приложения нужны. Мелочь, но приятно до невероятности.

Я вам скажу вот какую вещь: я на работе использую приложение, которое называется Slack. В данном случае это не столь важно, но в Slack мне присылают во время эфиров на «Теосе» отзывы от слушателей. Иногда слушатели используют эмодзи. Есть товарищи, у которых эмодзи больше, чем слов и даже больше, чем букв. И я должен всё это читать на брайлевском дисплее. А при выводе на брайлевский дисплей, не может же он вывести все эти эмодзи, и он описывает их. То есть, на двадцатиклеточном брайлевском дисплее я должен проскочить, этот дисплей прокрутить, пока прочту эти описания пяти-шести эмодзи, которые стоят один к другому. А мне это не надо, потому что я в любом случае это вслух не читаю. Ну и, соответственно, делаются такие настройки, чтобы не читать эмодзи и сохраняются для конкретного приложения, в моём случае – Slack.

О. МОНАКО: Кристина спрашивает, есть ли новые языки в VoiceOver?

О. ШЕВКУН: Я не готов отвечать на этот вопрос сейчас. Не знаю. Кристина, задаёшь всегда такие вопросы! Друзья, скажите, есть ли новые языки в VoiceOver? Наверное, имеются в виду речевые движки. У нас не так много времени осталось, но скажу про ускорение. Ускорение работы с брайлевским дисплеем. Это совершенно очевидно. Это ускорение ввода по Брайлю. Это использование для многих языков там, где есть такая возможность. В библиотеке LibLouis. LibLouis, к сожалению, по-русски не существует. То есть, она существует, но она не в таком состоянии, чтобы эту русскую таблицу для ввода и вывода можно было бы использовать, поэтому для русского языка там только та системная таблица, к которой мы уже привыкли, и которая работает очень неплохо. Но для других языков LibLouis тоже есть. И в общем для работы по Брайлю iPhone стал гораздо удобнее, как и все устройства. Так что, бесплатное обновление, когда оно придёт на ваш iPhone или iPadOS на ваш iPad, ставьте, не бойтесь!. Конечно, какие-то проблемы могут быть, но они постепенно будут решаться. По-моему, это одно из лучших обновлений, которые я помню.

О. МОНАКО: Для эмодзи у безрамочных телефонов теперь отдельная кнопка есть.

О. ШЕВКУН: Чтобы что?

О. МОНАКО: Не знаю, чтобы что. Это слушатели пишут.

О. ШЕВКУН: Я хочу безрамочный iPhone.

О. МОНАКО: А по поводу VoiceOver пишут: он иногда достаточно прикольно озвучивает смайлики, пишет Евгений.

О. ШЕВКУН: Конечно, озвучивает. Прикольно озвучивает. Но, Евгений, когда ты сидишь у микрофона, и у тебя двадцатиклеточный дисплей, и тебе нужно быстро читать сообщения, и главное, Ольги рядом нет, Татьяны рядом нет, вот когда это пишут, хочется просто забить. Вот, такая история. Я думаю, что тут будут и другие. Конечно, куча других возможностей. Но я сказал с точки зрения доступности о том, что мне, как пользователю, было интересно.

Расскажите о том, что вам интересно! В среду мы будем продолжать этот разговор. Мы будем читать ваши письма, ваши комментарии, и то, что вам интересно в доступности iPhone, мы прочитаем. Оль, читаем письма или идём дальше?

О. МОНАКО: Идём дальше.

О. ШЕВКУН: Ещё одно обновление на горизонте – JAWS 2020. К сожалению, мы не имеем возможности сейчас говорить об этом подробнее, потому что компания Vispero, частью которой является Freedom Scientific, не выпустила пока информацию, но информация выйдет уже на этой неделе. Следите, пожалуйста, за сайтом компании. Будет встреча, прямой эфир, которую компания Freedom Scientific проводит на платформе Zoom. Это платформа для телеконференций. Это будет в ночь с пятницы на субботу. В пятницу, в 20:00 по какому-то из американских временных поясов. Кому удобно, кому интересно, зайдите на сайт Freedom Scientific. Информацию найдёте и сможете присоединиться. На этой же неделе также выйдет подкаст, скорее всего, в котором эта информация тоже будет о новшествах JAWS 2020. Всё, что мы сейчас можем сказать, основано лишь на открытых источниках, которые можно было проанализировать. Чего ждать от JAWS 2020? Во-первых, не ожидайте сразу кучи новых “фишек”, потому что новые “фишки” теперь добавляются постепенно, в течение всего года. Наверное, что-то будет. Точно что-то будет с самого начала, но потом на протяжении года будет добавление новых возможностей. Во-вторых, я бы ожидал, что, наконец, что-то начнут делать с JAWS-курсором. Те из вас, кто пользуется JAWS, знают, что в современных операционных системах, в частности, конкретно в Windows 10, с JAWS-курсором большие-большие проблемы. Давно обещали эти проблемы как-то решать. Очень надеюсь, что их будут и дальше решать. В-третьих, улучшение, которое я очень ожидаю, – улучшение поддержки для онлайн-приложений. В частности Google Docs. Оль, у меня к тебе вопрос: смотри, ты часто работаешь с документами. У тебя ещё Microsoft Office или ты Google Docs используешь, или и то, и другое, или как?

О. МОНАКО: И то, и другое, естественно. Ну, отправлять-то всё равно приходится в формате Microsoft Office. Но редактирую я в Google Docs, потому что это гораздо удобнее.

О. ШЕВКУН: Хорошо.

О. МОНАКО: И самое главное, можно не бояться, что всё упадёт, и ты зря работал 4 часа.

О. ШЕВКУН: А вдруг Google упадёт?

О. МОНАКО: Ну, Google падает как-то реже, чем Microsoft.

О. ШЕВКУН: Да, и вот поэтому я очень ожидаю, что в новой версии JAWS будут улучшения, как раз касающиеся поддержки всех этих онлайн-сервисов. Вот, это такой тренд. Могу ли я сказать: «Да-да, ребята, это в новой версии будет!». Конечно, не могу. Никакой официальной информации пока нет, но в своих публикациях, в своих интервью сотрудники компании “Freedom Scientific” очень о многом говорили, поэтому некоторые предположения мы можем сделать уже сейчас. Я думаю, что через неделю мы увидим, что из этого сбылось, что – нет.

Скажу, кстати, ещё вот о чём: через неделю нам будет не до JAWS. Через неделю у нас в «Тифлостриме» наша постоянная слушательница, Элишка Глуши (Eliška Hluší) из города Брно, Чехия, вместе со своим мужем Зденеком (я пока не знаю, будет Зденек в эфире, или нет) и с двумя собаками-проводниками. Я сейчас думаю, технически как мы будем показывать собак? Ну, и второй вопрос: как мы интервьюировать их будем?

О. МОНАКО: Я думаю, они дадут прекрасные комментарии.

О. ШЕВКУН: Посмотрим. А что у нас в комментариях от слушателей?

О. МОНАКО: А у нас Фантомас, например, говорит о том, что не нравится ему JAWS никак и ни в какую, и NVDA лучше.

О. ШЕВКУН: Это сейчас у нас будет спор про iOS и Android. Это из той же плоскости.

О. МОНАКО: Да-да. Мне кажется, всё к тому идёт.

О. ШЕВКУН: Холиварчик такой. Да, кому-то нравится, кому-то не нравится, но здесь нужно понять, что сама стратегия обновлений JAWS претерпевает изменения. Если раньше мы имели одну версию, и там было обновление на весь год, и где-то ещё через полгода выходило какое-то обновление, исправление ошибок, то сейчас это по-другому у них устроено. Сейчас это, скорее, такая подписная история за не подписные, а весьма большие деньги.

О. МОНАКО: Олег, ты заинтриговал. Александр спрашивает, будет ли у собак микрофон? А Ксения, возвращаясь к теме с Google Docs, говорит о том, что они на работе уже вообще Microsoft Office не используют.

О. ШЕВКУН: Так мы на работе тоже Microsoft Office не используем, Оль.

О. МОНАКО: То есть, это одна я использую Microsoft Office?

О. ШЕВКУН: Не, не одна. Друзья, расскажите, кто ещё на работе использует Microsoft Office? Здесь у нас тоже, да, всё в доксах, такой огромный Google Sheets.

О. МОНАКО: Это же очень удобно.

О. ШЕВКУН: Кому как. Тут нужно, чтобы был нормальный доступ. Ксения, вам удобно? Расскажите нам, пожалуйста, об этом. Микрофон собакам проще сделать. Я не очень знаю другое. Я не очень знаю, как им сделать камеру…

О. МОНАКО: С iPhone 11 трансляцию.

О. ШЕВКУН: Ты проспонсируешь?

О. МОНАКО: Конечно, обязательно!

О. ШЕВКУН: Я, кстати, скажу: мы пару недель назад говорили о том, что для развития канала нужен компьютер. И, друзья, спасибо вам огромное! Некоторые из вас уже присоединились к этому делу и пожертвовали немаленькие суммы. Я думаю, что у нас к концу месяца будет новый компьютер. Будет повышенное качество видео. Будет 60 FPS ну или 50 FPS, а не 25, как у нас сейчас. Так что, этот вопрос решается. Спасибо вам большое! Идём дальше, нас гость по скайпу заждался. Алексей Самойлов написал нам: «Я тут создал приложение для того, чтобы распознавать фото. Вот адрес. Можно закачать на эту страничку фотографию и возвращается описание этой фотографии. Есть также дополнение для NVDA и есть также бот ВКонтакте, который называется Vision Bot». Алексей Самойлов с нами. Алексей, добрый день!

Алексей САМОЙЛОВ: Добрый день! Я, кстати, Фантомас, я самый.

О. ШЕВКУН: Алексей, как до жизни такой дошли? Я предполагаю, что вы зрячий человек.

А. САМОЙЛОВ: Нет, я полностью незрячий с рождения. Мне в 2010 году подарили компьютер, и самый мой первый был вопрос: как это всё работает изнутри? И с 2010 года я увлёкся программированием. Ну, и стал изучать web-технологии, JavaScript и т. д. Для Windows начал какие-то программки делать небольшие. Ну, и потом на форумах сидел, там людям помогать, сам знаний набираться. А история создания Vision Bot была следующая: мне всё чаще попадались в ВК группы, где много картинок с текстом. И я думал, как бы их читать? Потому что и друзья их к себе репостят, а я не могу их читать. Я раньше пользовался сторонними приложениями. Например, Google Translate. Там заходишь в импорт камеры и перевод, выбираешь из вложений, но это очень долго. Нужно произвести слишком много действий, ещё и ждать результата. Потом я стал искать другие приложения. Нашёл: ID-vision, Envision, ещё какие-то программы. Но или они были платные, или долго ждать приходилось, или меня они не устраивали. Там были ошибки, качество было не очень хорошее. Я так мучился-мучился, и однажды, а именно 15 августа, решил создать свою программу. И за одну ночь буквально загорелся этой идеей и сделал.

О. ШЕВКУН: Подождите, давайте, всё-таки называть вещи своими именами. Ведь то, что вы сделали – это, допустим, есть приложение Seeing AI, которое делает то же самое. Более того, те описания, которые выдаёт ваш бот, – это практически те же самые описания. То есть, то, что вы сделали, насколько я понимаю, исправьте меня, пожалуйста, если я ошибаюсь, – это удобный русский интерфейс для этих сервисов, которые вам такое описание возвращают.

А. САМОЙЛОВ: Да, это интерфейс. И во-первых, он доступен с любого устройства, не только с iPhone, например, во-вторых, я туда русский язык добавил, как вы сказали.

О. ШЕВКУН: А как делается перевод? Вы через Google это прогоняете?

А. САМОЙЛОВ: Да, через Google. На Гетхабе нашёл библиотеку для этого, и всё.

О. ШЕВКУН: То есть, вы, так, чтобы было понятно, прикрутили друг к другу несколько вещей?

А. САМОЙЛОВ: Да, несколько. И там у меня не только Microsoft используется. Там сразу несколько приложений, и они друг друга дополняют. Вот, например, у меня была фотография. На ней: зал, воздушные шары и люди. И одно приложение перечисляет только, что там: зал, украшения, воздушные шары. А другое только людей, и всё. А вместе они дают полную картину.

О. ШЕВКУН: А вы как-то потом обрабатываете или вы просто ставите одно за другим, и пользователь просто получает дубликат информации?

А. САМОЙЛОВ: Сначала я так и делал, а потом мне стали сообщать об ошибках, и я сам начал находить ошибки, и я уже сделал массив, где делаю изменения. Вот, если мне говорят: вот это неправильно, было в начале: он почему-то светлые волосы считал каштановыми или чёрными.

О. ШЕВКУН: Там действительно проходит несколько моментов, потому что вы же пользуетесь Google Translate. А Google Translate вносит свои проблемы. Ну, например, я как-то давал фотографию для распознавания, и он мне пишет: на фото три человека, молодость. Как можно сфотографировать молодость? Я понял, там youth. Youth – ещё и молодёжь. То есть, проблемы возникают и от сервера, который выдаёт эти результаты, и на этапе Google Translate, и надо понимать, что вы далеко не всегда можете этим управлять. Что вы можете, и чего вы сделать не можете? Чтобы пользователям было понятно.

А. САМОЙЛОВ: Что я могу? Ну, там ещё картинка делится на несколько областей. x1, y1, x2, y2, и для каждой области возвращается точность. Она может быть 0.2 или 0.8. Чем выше эта цифра, тем больше вероятность, что он распознал правильно. То есть, можно ещё по этим параметрам отфильтровывать. Я тоже так делал. То есть, отфильтровывал массив. Ну, и ещё я в интернете прочитал, как создать свою нейросеть. И, в принципе, на Питоне (Язык программирования Pithon. – Ред.) уже есть библиотеки для этого.

О. ШЕВКУН: Сидит он себе в городе Гусь-Хрустальный и читает в интернете…

О. МОНАКО: И создаёт нейросети.

О. ШЕВКУН: XXI век, Оль.

А. САМОЙЛОВ: Ну, да, я на Хабре читал про это. И там, в принципе, нормально написано. И думаю: ну, что, по сути, делаешь функцию для обучения, скармливаешь ей изображение и описание, и она примерно так распознаёт.

О. ШЕВКУН: Я просто хочу обратить на это внимание некоторых представителей того же ВОС. Вы там думаете о том, как предприятия спасать, а люди сидят в городе Гусь-Хрустальный и читают на Хабре и создают нейросети!

О. МОНАКО: Свои предприятия.

О. ШЕВКУН: Ловите разницу, ребята.

А. САМОЙЛОВ: Вообще, сначала я сделал программу для себя. У меня сначала не было идеи с кем-то делиться. У меня много есть программ, которые я делаю для одного себя. Но эта программа получилась такой успешной. Я сижу, картинки уже читаю, уже радуюсь. Тысячу картинок прочитал довольно-таки быстро. Там всего три нажатия. Помните, я рассказывал, как мне приходилось раньше мучиться с Google Translate? А здесь всего три нажатия: поделиться, Vision Bot, отправить. Всё. Вот три касания пальцем, и сразу же получаешь результат.

О. ШЕВКУН: Слушайте, а что там с распознаванием текста?

А. САМОЙЛОВ: Распознавание текста работает очень хорошо. По тестам некоторых пользователей даже лучше. Меня в Telegram добавили в беседу, где много человек общается. Там пробовали и счётчики распознавать, и глюкометры. И говорят, что Envision не распознал, FineReader тоже не распознал. Другие тоже никак не распознавали. А мой бот распознал. И они мне прислали даже доказательство – скриншот экрана, где другие программы ничего не распознали, а мой бот распознал.

О. ШЕВКУН: Так, я сейчас буду наглеть, Алексей, когда будет приложение для Android и iOS, и от чего это зависит?

А. САМОЙЛОВ: Ну, я ещё приложения пока никогда не делал.

О. ШЕВКУН: То есть, вам нужно на Хабре прочитать?

А. САМОЙЛОВ: Ну, я читал, но не знаю. Мне проще сделать версию для браузера и вывести ярлык на домашний экран.

О. ШЕВКУН: То есть, тут интересная вещь. То, что сделал Алексей, – это такая забавная система, такой конструктор из кубиков. Есть некоторые кубики, которые нужно соединить, которые нужно представить в нормальном, удобном интерфейсе. В том же самом JAWS эта “фишка” была как новая возможность в JAWS 2019, который мы представляли в марте или в апреле – smart picture. А Алексей это сделал для NVDA и для всех. Там у нас что-нибудь пишут, Оль?

О. МОНАКО: Ксения говорит правильные вещи: “Я думаю, что каждый должен заниматься своим делом. Я вот программы писать не умею, а научить, как ими пользоваться – запросто. Главное, дайте где».

О. ШЕВКУН: Правильно, а то программисты начинают учить, а они говорят на каком-то своём даже не языке, наречии.

О. МОНАКО: На своих символах.

А. САМОЙЛОВ: Я сейчас планирую переехать на новый сервер и сделать режим распознавания в реальном времени. То есть, просто зашёл на сайт, он запросил доступ к камере, и он каждую секунду будет сканировать то, что перед камерой находится и в автоматическом режиме распознавать. То есть ничего уже нажимать не надо будет. Если программа экранного доступа включена, оно само будет зачитываться. Я сейчас скоро перееду на новый сервер и это сделаю.

О. ШЕВКУН: Алексей, сложный вопрос вам задам. Чем, по-вашему, продвинутый пользователь отличается от обычного? Это какие-то способности, которые у человека должны быть? Это желание? Вы – математик? То есть, вы в школе всё это любили? Как это для вас было?

А. САМОЙЛОВ: С математикой я не дружу вообще. Мне, конечно, стыдно признаваться на аудиторию, но базовый уровень в математике сдал на «три». Но если брать языки высшего уровня, такие, как Pithon тот же, JavaScript какой-нибудь, то здесь математика не нужна. Если мы будем разрабатывать на C++, или драйвера делать для железа, там да, математика нужна. А если брать языки более высшего уровня, там, по сути, просто английские слова и скобочки.

О. ШЕВКУН: То есть, я так понимаю, вы нашли свою нишу, которая при этом оказалась полезной и другим? То есть вы стали делать то, что вам интересно, то, что у вас получается, а потом смотрите – и, оказывается, это и людям полезно тоже.

А. САМОЙЛОВ: Именно так.

О. ШЕВКУН: В описании эфира мы дадим ссылки на сайт Алексея (https://visionbot.ru/) и группу ВКонтакте (https://vk.com/visiontest1). Алексей, спасибо большое! И успехов вам! Я думаю, также будем дальше отслеживать. Я понимаю, что сразу возникает такой вопрос у людей, которые хотят, чтобы всё было проговорено точно. Алексей говорит, что сделал программу для распознавания за один вечер. Нет, Алексей из нескольких ресурсов составил нечто такое, что этим распознаванием занимается. Но если кто-то из вас скажет: «Да ладно, это не программа. Это всё – фигня!». Тогда вопрос: а что же вы это не сделали за один вечер? Спасибо, Алексей! Всего доброго!

О. МОНАКО: Спасибо!

О. ШЕВКУН: Мы идём дальше. То, что недавно было сложно, что, казалось, требует большой команды – оно, действительно, требует команды, и огромное участие в работе, которую мы сейчас описываем, принимают другие люди. Те, кто делает вот эти серверы возвращающие, описание картинок, те, кто делают гугл-переводчик и так далее. Алексей говорит: «У меня есть NVDA, у меня есть браузер, я хочу всё это объединить, чтобы это удобно работало, на такой вот народной инициативе за один вечер». Он всё-таки поскромничал, за один вечер была первая версия, потом он дорабатывал, и потом остальное всё получается. Мне почему-то кажется, что Алексей от скромности не умрёт, ну уж точно. А с другой стороны, у нас есть замечательные люди, наши слушатели и зрители, которые помогают нам, и авторам нашей передачи, и участникам передачи, не заноситься. Я думаю, друзья, что вы будете ставить перед Алексеем новые задачи, обращать внимание на ошибки, ну как раз… В общем, вы поняли.

Ольга МОНАКО (смеётся).

О. ШЕВКУН: Что-то пишут, или можно дальше?

О. МОНАКО: (улыбается) Можно дальше.

О. ШЕВКУН: Ещё одна тема. Я сейчас попытаюсь вызвонить ещё одного человека. История, о которой нам рассказали недавно, это история группы ВКонтакте, которая посвящена мемам. Ой, я пока звоню, ты объясни, пожалуйста, тем, кто может быть не в курсе, разницу между просто картинкой и мемом. Чем мем отличается от просто картинки?

О. МОНАКО: Чем мем отличается от картинки – это тема научной работы.

О. ШЕВКУН: Ну, ладно.

О. МОНАКО: Мем – это устоявшаяся шутка, скажем так, какое-то описание, которое применимо к разным ситуациям. Когда говоришь: «Карл», всем понятно, о чём речь, понятна эмоция, что хотел сказать твой собеседник. Как сказать, картинка… Ну вот просто есть котик, и что? Зачем этот котик, для чего этот котик? А в меме уже заложена определённая смысловая нагрузка, и у него есть своя чёткая формулировка.

О. ШЕВКУН: Послушайте, а есть люди, которые, как я сейчас, не поняли? Потому что я знаю, я слышал слово «Карл»…

О. МОНАКО: Карл – он даже без картинки Карл.

О. ШЕВКУН: Объясни.

О. МОНАКО (смеётся).

О. ШЕВКУН: Я не понял. Вся эта история про текстовые мемы – она про это. Незрячим людям зачастую бывает трудно понять то, что у всех даже не на слуху, а то, что у всех на виду. Когда говорят «Карл», что имеется в виду и откуда это?

О. МОНАКО: Это из сериала «Ходячие мертвецы», собственно, мем откуда пошёл… Стоп-кадр, скриншот: стоит сын и его отец, отец стоит такой, уперев руки в колени, чуть-чуть согнувшись к нему. Не помню, что было по факту в сериале на тот момент, но он обращается к сыну, а сына зовут Карл.

О. ШЕВКУН: Так…

О. МОНАКО: Эмоциональный посыл в том, что «Ну, блин, как так можно, Карл, ну вот почему ты это делаешь?» И вместо того, чтобы набирать кучу ненужных каких-то оборотов, возможно, оскорбительных или ещё каких-то, просто говорят: «Ну Карл!..»

О. ШЕВКУН: Вот эта история с мемами. Действительно, возникает ситуация, когда людям, которые не видят и не всегда смотрят сериалы, какие-то вещи непонятны. И вот написали нам сюда, на Tiflo.info, в редакцию «Тифлострима», про группу, которая, собственно говоря, живёт ВКонтакте, называется «Текстовые мемы» и посвящена описанию этих самых мемов. И мы связались с этой группой, там, насколько я понимаю, несколько волонтёров, несколько добровольцев, они там решали, кто из них будет выходить на связь, Даниил Жигайло сейчас с нами на связи, один из волонтёров вот этой самой группы, «Текстовые мемы». Даниил, добрый день!

Даниил ЖИГАЙЛО: Добрый вечер!

О. ШЕВКУН: Добрый вечер! Мем «Карл» вам, вероятно, знаком. Вы, в отличие от меня, были в теме сразу, правильно?

Д. ЖИГАЙЛО: Да.

О. ШЕВКУН: Давайте вот с чего начнём: как родилась ваша идея – группа ВКонтакте, «Текстовые мемы», кому это было надо, и зачем это было надо?

Д. ЖИГАЙЛО: Давайте. Основной работой по поиску этих самых мемов занимаюсь я и создатель группы Александр. У нас есть команда, которая нас поддерживает, помогает решать различные вопросы.

О. ШЕВКУН: Эти люди, эта команда, она откуда появилась? Вы зрячие, незрячие, почему вдруг этим озадачились? Никто не озадачился, а вы взяли и озадачились.

Д. ЖИГАЙЛО: Как всё произошло: создатель группы Александр хотел создать что-то своё, уникальное, и чтобы это принесло людям пользу. Он обсудил этот вопрос со знакомыми, и было решено сделать группу с мемами для незрячих людей.

О. ШЕВКУН: Wow!

Д. ЖИГАЙЛО: Таких групп на тот момент почти не было, или они были в заброшенном состоянии. Так и появилась наша группа.

О. ШЕВКУН: Вы оба зрячие люди – Александр и вы?

Д. ЖИГАЙЛО: Да, Александр и я  зрячие. У нас один из членов команды незрячий человек, мы с ним консультируемся по всем вопросам.

О. ШЕВКУН: Что было раньше? Сначала была идея сделать группу для незрячих, и вы потом нашли незрячего, или сначала был незрячий знакомый, вы смотрите и говорите: «А давайте мы этим делом займёмся!»

Д. ЖИГАЙЛО: Сначала была идея. Потом пообщались со знакомыми и нашли незрячего человека.

О. ШЕВКУН: И стали искать незрячего человека под эту идею. Реакция незрячих была какая? Они сразу сказали: «Ой, ребята, как классно!», или пришлось убеждать? «О чём мемы, какие мемы, ну Карл!»

Д. ЖИГАЙЛО: Нет, убеждать никого не пришлось, все были заинтересованы в сотрудничестве.

О. МОНАКО: Олег, смотри, ты, видишь, быстро понял, как применять Карла.

О. ШЕВКУН: Ты объяснила хорошо. Собственно, это как раз то, чем занимаются в этой группе. А как у вас выглядит этот процесс, как попадает мем в вашу группу? Есть один путь, есть несколько путей, как это работает?

Д. ЖИГАЙЛО: Нет, путь чаще всего один, хотя нет, не так. Либо мы находим мемы, которые нам нравятся, и описываем их, либо люди нам присылают их в предложку в группе. Тогда мы их тоже описываем, если они нам понравятся.

О. ШЕВКУН: Ну, я задам идиотский вопрос (на то я и ведущий, чтобы их задавать), как мне понять, это мем или просто картинка? То есть, как я могу понять, что это что-то такое, что можно, что нужно прислать в группу, или это не мем? Потому что это как раз к тому вопросу, который я Ольге поставил – чем мем отличается от картинки?

Д. ЖИГАЙЛО: Я хоть и описываю мемы, но не совсем в этом деле специалист, мемом может быть просто картинка, какая-то культурная единица, которая скорее всего в какой-то степени должна быть известна, она может быть смешной, может быть несмешной, бывают разные мемы.

О. МОНАКО: Да, критерий в том, что, поддержу, она часто встречается, часто повторяется. Потому что если это мем, то цепляешься за него постоянно, и, значит, появляется необходимость его распознать.

О. ШЕВКУН: То есть, критерий – это его повторяемость.

Д. ЖИГАЙЛО: Да.

О. ШЕВКУН: А скажите, пожалуйста, есть какие-то критерии описания мемов? То есть, как вы отличаете хорошее описание мема от плохого? Знаю, что вы не выдадите всех секретов фирмы, но, может, какой-то технический там должен быть? Как это работает?

Д. ЖИГАЙЛО: Вообще я стараюсь следовать небольшой технологии, чтобы всё было предельно просто и ясно, и, в первую очередь, когда описываем мем, указываем основные черты.

О. ШЕВКУН: Сколько человек сейчас занимается описанием мемов в вашей группе?

Д. ЖИГАЙЛО: Два человека. Я и Александр.

О. ШЕВКУН: Я напрямую задам этот вопрос: человек посмотрел, послушал, Ольга провела этот эфир, и он говорит: «Я хочу описывать мемы». Вам сейчас помощь нужна? Или вы пока справляетесь, и вам, как говорится, «меньше народу – больше кислороду»?

Д. ЖИГАЙЛО: Нет, помощь нам всегда нужна, мы рады любым новым помощникам, мы хотим расти и чтобы наши мемы увидело как можно большее число людей.

О. МОНАКО: Слушайте, а сколько мемов в день вы описываете?

Д. ЖИГАЙЛО: Знаете, преимущественно три мема в день, то есть синоптический ряд.

О. ШЕВКУН: Оля, а вот ты мне объясни, с этой скоростью, три-четыре мема в день, на их жизнь мемов хватит?

О. МОНАКО: Конечно, хватит. Нам ещё надо теперь вычислить скорость, с которой в день появляются мемы.

О. ШЕВКУН: Причём мемы не только русскоязычные. Они в любом случае по своей природе интернациональны, поэтому вам приходится иметь дело и с надписями на других языках, и так далее, на английском, прежде всего. Есть ли какие-либо ограничения: политические ограничения, цензурные ограничения, что-то такое, что вы смотрите и говорите: «Этот мем про Навального, я его описывать не буду. Или: «Это секс, мы это делать не будем». Или вы открыты?

Д. ЖИГАЙЛО: Мы хотим, чтобы в группе была позитивная и конструктивная атмосфера и потому стараемся не размещать мемов, которые могут вызвать негодование или споры.

О. ШЕВКУН: Слушайте, а это довольно сложно, потому что мы тут про айфоны рассказывали, негодование, конечно, не вызвали, но споры вызвали. Вы не боитесь по тонкому льду ходить, ребята?

Д. ЖИГАЙЛО: Не знаю, стараемся всем угодить, и чтобы какого-то негатива и споров в группе не было. Нет, споры – это хорошо, а негодование – это плохо.

О. ШЕВКУН: Оля, что у нас в письмах, сообщениях, в комментариях?

О. МОНАКО: Что-то не хотят про мемы разговаривать.

О. ШЕВКУН: Не хотят про мемы разговаривать.

О. МОНАКО: Не хотят…

О. ШЕВКУН: А я скажу даже, почему: вот сообщество…

О. МОНАКО: Все пошли читать описания.

О. ШЕВКУН: Дело в том, что сообщество незрячих надо ещё приучать к этой истории, потому что то, что мы разыграли, честно говоря, я знал этот мем про Карла, но мне нужно было показать ситуацию. История заключается в том, что зачастую мы не знакомы с этой частью культуры, у нас даже была идея делать передачу здесь на Tiflo.info, которая будет посвящена визуальной части массовой культуры. Она действительно далеко от нас. Но то, что вы, ребята, делаете, это классно! Вы как раз с этой частью культуры и знакомите. А как вас найти во ВКонтакте?

Д. ЖИГАЙЛО: У нас достаточно простой адрес, можно набрать в поисковой строке «текстовые мемы», по-русски или по-английски vk.com/textmeme.

О. ШЕВКУН: И обязательно мы также дадим в описании, если вы также смотрите чат, киньте, пожалуйста, в чат эти ссылки, чтобы у людей они были, а в описании эфира мы эти ссылки обязательно дадим. Даниил, и вам, и Александру заочно огромное спасибо.

Сегодня два проекта было: истории, которые раньше никто не делал, а люди взяли и сделали. И это классно! Спасибо, Даниил!

Д. ЖИГАЙЛО: Спасибо вам!

О. ШЕВКУН: Такие вот дела.

О. МОНАКО: Я, кстати, посмотрела тут этот паблик, могу сказать, что это достаточно забавно даже для зрячих, не то что для незрячих.

О. ШЕВКУН: Почему?!

О. МОНАКО: Потому что периодически очень странно… Я попробовала читать описание для незрячих, не смотря на картинку, а потом смотреть на картинку, и то, что получается в голове, и то, что видишь – оно не всегда одинаковое. То есть, процесс описания, ты смотришь на картинку, и тебе надо её описать…

О. ШЕВКУН: Кстати, описание кинофильмов – та же самая история. Я подозреваю, что через годик придут какие-нибудь учёные, в очках, и скажут, и скажут: «А давайте мы с научной точки зрения осмыслим этот процесс и напишем диссертацию, и создадим ГОСТ по описанию мемов?» Но пока этого не произошло, давайте жить свободно и творить свободно, потому что по ГОСТу творчества не бывает. Оля, спасибо, что ты присоединилась к сегодняшнему эфиру…

О. МОНАКО: Спасибо, что позвал.

О. ШЕВКУН: Ну, а как я мог не позвать!.. Ольга Монако!..

О. МОНАКО: …Олег Шевкун.

О. ШЕВКУН: «Тифлострим». Всем пока!

О. МОНАКО: Хорошего вечера!

 

 

 

Рассказать друзьям