У Office 365 есть OCR?
Узнайте об распознавании оптических символов в Microsoft Purview (Предварительный просмотр)
Плата за использование OCR составляет 1 доллар США.00 на каждые 1000 пунктов отсканированы. Каждое изображение отсканирует как одна транзакция. Это означает, что отдельные изображения (JPEG, JPG, PNG, BMP или TIFF) каждый считается одной транзакцией. Это также означает, что каждая страница в файле PDF заряжен отдельно. Например, если в файле PDF есть 10 страниц, сканирование OCR файла PDF подходит как 10 отдельных сканирований.
Краткое содержание
В этой статье мы узнаем об оптическом распознавании символов (OCR) в Microsoft Purview (Preview) и его структуре ценообразования. Сканирование OCR – это дополнительная функция, которая позволяет Purview сканировать контент на изображениях для конфиденциальной информации. После включения вы можете настроить настройки OCR и применить существующие политики для предотвращения потери данных, управления записями и управления инсайдером рисками на изображения и текстовый контент.
Ключевые моменты
1. Сканирование OCR в Microsoft Purview позволяет сканировать контент на изображениях для конфиденциальной информации.
2. Сканирование OCR – это дополнительная функция, которую необходимо включить на уровне арендатора.
3. Вы можете выбрать места, где вы хотите сканировать изображения, включая Exchange, SharePoint, OneDrive, команды и устройства Windows.
4. Настройки OCR позволяют применять существующие политики для предотвращения потери данных, управления записями и управления инсайдером к изображениям и текстовым контенту.
5. Плата за использование OCR составляет 1 доллар США.00 на каждые 1000 пунктов отсканированы.
6. Каждое изображение отсканирует как одна транзакция.
7. Автономные изображения (JPEG, JPG, PNG, BMP или TIFF) считаются одной транзакцией.
8. Каждая страница в файле PDF заряжается отдельно. Например, 10-страничный PDF-файл считается 10 отдельными сканами.
9. Обмен и команды могут быть настроены для OCR по умолчанию. Чтобы включить OCR для SharePoint, OneDrive и устройств, зарегистрируйтесь на предоставленной ссылке.
10. Рабочий процесс для включения OCR включает в себя создание подписки Azure (при необходимости), настройка выставления счетов с оплатой как вы, а также настройка настройки сканирования OCR.
Вопросы и ответы
1. Что такое оптическое сканирование распознавания персонажей (OCR) в Microsoft Purview?
Сканирование OCR в Microsoft Purview позволяет сканировать контент в изображениях для конфиденциальной информации. Это дополнительная функция, которая должна быть включена на уровне арендатора.
2. Какие местоположения могут быть настроены для сканирования OCR в Microsoft Purview?
Вы можете настроить устройства Exchange, SharePoint, OneDrive, Teams и Windows для сканирования OCR в Microsoft Purview.
3. Как рассчитывают платы за использование OCR?
Плата за использование OCR составляет 1 доллар США.00 на каждые 1000 пунктов отсканированы. Каждое изображение отсканировано как одна транзакция, а отдельные изображения (JPEG, JPG, PNG, BMP или TIFF) считаются одной транзакцией. Каждая страница в файле PDF заряжается отдельно.
4. Обмен и команды уже настроены для OCR?
Да, обмен и команды уже настроены для OCR по умолчанию. Чтобы включить OCR для SharePoint, OneDrive и устройств, вам необходимо зарегистрироваться, используя предоставленную ссылку.
5. Каковы предварительные условия для использования OCR сканирования в Microsoft Purview?
Предварительные условия для использования SCANNING OCR в Microsoft Purview включают в себя получение подписки Azure Pay-As-You-Go. Если нет, глобальный администратор должен настроить это.
6. Как я могу настроить биллинг для OCR в Microsoft Purview?
Чтобы включить OCR, ваш глобальный администратор должен настроить платежную платеж. Подробные инструкции можно найти в предоставленной ссылке.
7. Как я могу оценить мой счет за использование OCR в Microsoft Purview?
Сначала вы можете начать с ограничения использования несколькими пользователями и применимых рабочих нагрузок. Через некоторое время вы сможете просмотреть свой счет в Azure и увидеть статистику использования и сборы за каждый день. Тег «Рабочая нагрузка» в управлении затратами в Azure может помочь вам увидеть разбивку использования на рабочую нагрузку.
8. Как я могу настроить настройки OCR в Microsoft Purview?
Чтобы настроить настройки OCR в Microsoft Purview, перейдите на портал соответствия Microsoft Purview и перейдите в раздел «Настройки». Оттуда выберите «Оптическое распознавание символов (OCR) (предварительный просмотр)», чтобы ввести настройки конфигурации OCR.
9. Cons Cons Scanning обнаруживает символы на изображениях для всех конфиденциальных типов информации и обучаемых классификаторов?
Да, когда включена OCR, все конфиденциальные типы информации и обучаемые классификаторы могут обнаруживать символы, которые находятся на изображениях.
10. Что происходит, когда изображение содержит несколько страниц?
Когда изображение содержит несколько страниц, каждая страница считается отдельным сканированием. Например, если в файле PDF есть 10 страниц, сканирование OCR файла PDF подходит как 10 отдельных сканирований.
11. Какие политики применяются к изображениям и текстовым контенту во время сканирования OCR в Microsoft Purview?
Во время сканирования OCR в Microsoft Purview, существующие политики по предотвращению потери данных, управлению записями и инсайдерским управлением рисками применяются к изображениям и текстовым контенту.
12. Могу ли я просмотреть свой счет для использования OCR в Microsoft Purview?
Да, вы можете просмотреть свой счет, следуя инструкциям, описанным в документе «Monite Your Microsoft Syntex Pay-As-You-Go».
13. Могу ли я настроить сферу сканирования OCR в разных местах и решениях?
Да, вы можете определить область (пользователи/группы/сайты) для сканирования OCR в разных местах и решениях в настройках конфигурации OCR.
14. Доступно ли сканирование OCR для всех типов файлов в Microsoft Purview?
Сканирование OCR доступно для автономных изображений (JPEG, JPG, PNG, BMP или TIFF), а также PDF-файлы.
15. Может ли сканирование OCR обнаружить номера кредитных карт как в текстовом, так и в изображениях?
Да, если вы настроили условие предотвращения потери данных (DLP) для номеров кредитных карт и включили его в виде конфиденциального типа информации, сканирование OCR в Microsoft Purvie.
Узнайте об распознавании оптических символов в Microsoft Purview (Предварительный просмотр)
Плата за использование OCR составляет 1 доллар США.00 на каждые 1000 пунктов отсканированы. Каждое изображение отсканирует как одна транзакция. Это означает, что отдельные изображения (JPEG, JPG, PNG, BMP или TIFF) каждый считается одной транзакцией. Это также означает, что каждая страница в файле PDF заряжен отдельно. Например, если в файле PDF есть 10 страниц, сканирование OCR файла PDF подходит как 10 отдельных сканирований.
У Office 365 есть OCR?
Охто
Мы аррегировали подоаджолгн. SpoMOщHщ эtOй straoniцы mы smosememememopredetath, чto -aprosы otpra. То, что нужно?
Эta -steraniцa otobrana -overshy -aTeх -stuчah -obra -aTeх -stu -y -y -ogdaTomAtiчeskymi -stri -stri -rah -strhe -strhe -strhe -stri -stri -stri -stri -stri -stri -rah -rah -stristriouri Котора. Straoniцa -oprepaneTeTeTeTeTOTOTOTO -opobrasthep -apoSle -o, kak -эat. ДО СОМОМОНТА.
Иошнико -а -а -а -в -впологовый схлк -а -апросов. Esli-yspolheoute obhщiй dostup-vanterneTTHETHETHETHETHET,. Охраторс. Подеб.
Проверка, в котором я, eSli -voAchephephephephe -yvodyte -sloжne -apro Эмами, Или,.
Узнайте об распознавании оптических символов в Microsoft Purview (Предварительный просмотр)
Сканирование оптического распознавания символов (OCR) позволяет Microsoft Purview для сканирования контента на изображениях для конфиденциальной информации. Дополнительная функция, сканирование OCR сначала включено на уровне арендатора. После включения вы выбираете места, где вы хотите сканировать изображения. Сканирование изображений доступно для Exchange, SharePoint, OneDrive, Teams и Windows Devices. После настройки настройки OCR ваши существующие политики для предотвращения потери данных (DLP), управления записями и управления инсайдером (IRM) применяются к изображениям и текстовому контенту. Например, скажем, вы настроили условие DLP Контент содержит конфиденциальную информацию и включил классификатор данных, такой как тип конфиденциальной информации «кредитная карта» (SIT). В этом случае Microsoft Purview сканирует по номерам кредитных карт как в текстах, так и на изображениях во всех выбранных местах.
По умолчанию, Exchange и команды могут быть настроены для OCR. Чтобы включить OCR для SharePoint, OneDrive и Devices, подпишите здесь.
Рабочий процесс с первого взгляда
Фаза | Что нужно |
---|---|
Фаза 1: Создайте подписку на Azure, если это необходимо | Если в вашей организации уже нет подписки на Azure Pay-As You-Go для вашего арендатора, ваш глобальный администратор должен начать с создания учетной записи Azure. |
Фаза 2: Создайте платеж как выплачивание, чтобы включить OCR. | Ваш глобальный администратор или администратор SharePoint должен следовать инструкциям в настройке Microsoft Syntex Billing в Azure, чтобы добавить подписку на OCR. |
Фаза 3: Настроить настройки сканирования OCR | Администратор соответствия для вашей организации настраивает настройки OCR для вашего арендатора. |
Фаза 1: предпосылки
Чтобы использовать сканирование OCR, глобальный администратор вашей организации должен убедиться, что Azure Pay-As-You-Go находится на месте. Если нет, им нужно настроить это, следуя инструкциям в создании ваших первоначальных подписок Azure
Фаза 2: Настройка биллинга
Когда вы включите OCR, все конфиденциальные типы информации и обучаемые классификаторы могут обнаруживать символы, которые находятся на изображениях.
Поскольку это необязательная функция, ваш глобальный администратор должен настроить платежную платежную плату, чтобы включить OCR. Обратитесь к инструкциям в настройке Microsoft Syntex Billing в Azure, чтобы добавить подписку на OCR.
Когда вы заходите на биллинг Microsoft Syntex, чтобы подписаться на подписку OCR, вы делаете нет Нужно также подписаться на Microsoft Syntex.
Вы можете найти информацию о ценах с оплатой ocr на установленном плате Microsoft Syntex на странице Azure.
Обвинения
Плата за использование OCR составляет 1 доллар США.00 на каждые 1000 пунктов отсканированы. Каждое изображение отсканирует как одна транзакция. Это означает, что отдельные изображения (JPEG, JPG, PNG, BMP или TIFF) каждый считается одной транзакцией. Это также означает, что каждая страница в файле PDF заряжен отдельно. Например, если в файле PDF есть 10 страниц, сканирование OCR файла PDF подходит как 10 отдельных сканирований.
Чтобы просмотреть свой счет, следуйте инструкциям, описанным в Monitor Your Microsoft Syntex Pay-As-You-Go.
Оцените свой счет
Когда вы впервые начнете использовать OCR, ограничивайте использование только несколькими людьми и применимыми рабочими нагрузками. Через некоторое время вы можете просмотреть свой счет в Azure и увидеть статистику и сборы об использовании за каждый день. Оттуда вы можете экстраполировать затраты на полный набор пользователей. Кроме того, вы можете использовать тег «рабочей нагрузки» в управлении затратами на Azure, чтобы увидеть разбивку использования на рабочую нагрузку.
Фаза 3: Настройте настройки OCR
- На портале соответствия Microsoft Purview перейдите в Настройки.
- Выбирать Оптическое распознавание символов (OCR) (Предварительный просмотр) Чтобы ввести настройки конфигурации OCR.
- Выберите места, где вы хотите сканировать изображения. Затем, для каждого местоположения и решения, определите область (пользователи/группы/сайты) для OCR. Поддерживаемые местоположения и решения перечислены в следующей таблице.
Для получения информации о функциональности OCR в соответствии со соответствием связи Microsoft Purview см Создать и управлять политикой соответствия связи.
Расположение | Поддерживаемые решения |
---|---|
Обмен | Профилактика потери данных 1 |
Инсайдерское управление рисками 3
1 поддерживает только исходящие электронные письма.
2 поддерживает ключевые слова и конфиденциальные типы информации.
3 рассматривает конфиденциальные типы информации и обучаемые классификаторы, присутствующие на изображениях для оценки риска.
Какие типы файлов поддерживаются?
Эта функциональность поддерживает сканирование изображений в следующих типах файлов с отмеченными требованиями:
- Поддерживаются только изображения с текстом машины.
- Только изображения, загруженные после включения OCR, сканируются.
- Только отдельные изображения сканируются.
- SharePoint и OneDrive поддерживают только следующие типы файлов: JPEG, JPG, PNG и BMP.
- Советы по предотвращению потери данных не поддерживаются для изображений в обмене.
- Сканирование изображений в сжатых/архивных файлах не поддерживается.
- Если вы исключите путь в настройках предотвращения потери данных конечной точки, OCR не сканирует изображения в этих папках.
- Когда OCR включен для устройств Windows, устройства начинают отправлять сообщения в облако для сканирования. Предел полосы пропускания по умолчанию составляет 1024 МБ данных на устройство в день. OCR прекращает сканирование изображений после достижения этого ежедневного предела. Если вы хотите продолжить сканирование изображений, вы можете увеличить предел полосы пропускания.
Какие языки поддерживаются?
Сканирование OCR поддерживает более 150 языков.
Краткое содержание
- Вы можете подписаться на сканирование OCR без подписки на Microsoft Syntex.
- Настройка OCR происходит на уровне арендатора, поэтому после настроения OCR они доступны для всего стека Microsoft Purview.
- Вам не нужно создавать отдельные классификаторы данных для OCR. Как только OCR настроен, существующие конфиденциальные типы информации, точные типы конфиденциальных данных, основанные на данных, обучаемые классификаторы и отпечатки пальцев, находятся на сканированных изображениях, а также документы и электронные письма.
Смотрите также
- Узнайте о предотвращении потери данных
- Узнайте об управлении инсайдерским риском
- Узнайте о управлении записями
Обратная связь
Отправить и просмотреть обратную связь для
Бо Кэмерон
В прошлом году в Ignite Microsoft объявила о возможностях OCR, используя “Технология компьютерного зрения” Приедет в офис 365! Это вызвало много волнения, так как это была особенность, которую многие люди хотели годами! Microsoft опубликовала статью в TechCommunity о новом прогрессе в интеллектуальном поиске с использованием OCR, которую можно найти здесь. Ну, я рад сообщить, что это существует, и это, конечно, круто!
Поддерживаемые типы
Согласно статье TechCommunity выше, поддерживаемые типы “BMP”, “пнн”, “JPEG”, “JPG”, “гифка”, “тиф”, “Тифф”, “сырой”, а также “арв”, “CR2”, “крв”, “эрф”, “MEF”, “МРУ”, “нефт”, “nrw”, “Орф”, “пеф”, “RW2”, “RW1”, “SR2”.
Чтобы проверить эту возможность, я загрузил дизайн макета для надстройки службы поддержки, который я создал для Office 365 в библиотеку документов.
JPG выглядит так
Ты’Уведомление внутри изображения. Было насмешено 4 билета с небольшим количеством бекона Ipsum. Названия билетов “Проблема с SharePoint”, “Компьютер не работает”, “Нет проблем просто сказать привет” и “Проблема с SharePoint” снова. Мой план по протестированию OCR – поиск содержимого этого заголовка, используя SharePoint Search!
Тест: Поиск значений билетов
Мой первый тест будет пытаться найти один из помеченных билетов “Проблема с SharePoint” и посмотрите на результаты! Это не только соответствует значениям на изображении, но и’S также собирает другие значения билетов.
Неудивительно, что когда я ищу некоторые из описания билетов, они также должны вернуться в результаты поиска. я’В.Е. решил искать первое предложение описания в макете. Вот результат!
Это тоже работает в современном?
В моих предыдущих примерах я использовал SharePoint Classic Search. Если вам было интересно, работает ли это и в современном поиске, вы держите пари!
Как это работает?
Я предполагаю, что OCR в SharePoint использует Azure Media Services для преобразования текстового контента в цифровые файлы в цифровой текст. Причина предположения, что это связано с следующим соглашением о именованиях, используемой в SharePoint.
Всякий раз, когда SharePoint находит текст в ваших изображениях, значения хранятся в элементе в поле под названием MediaServiceocr. Взгляните на ответ JSON с запроса на элемент списка.
Я не был’возможность найти управляемое свойство по умолчанию для этого поля, но это не’T Огромная проблема, потому что SharePoint автоматически создает ползученное свойство под названием OWS_Mediaserviceocr. Используя это покрытое свойство, я могу создать любые управляемые сопоставления имущества, которые я хочу.
Некоторые комментарии
PDF -файлы OCR имеют нативную поддержку в Office 365. Тем не менее, сканируемые документы, которые в настоящее время являются PDF’t генерирование значений в столбце MediaServiceocr. я’я тестировал эту функциональность без успеха – но все же.
Я заметил некоторые несоответствия с функциональностью OCR. Я проверил это на нескольких библиотеках, и я заметил, что это есть’t создавал ценности MediaServiceocr по некоторым элементам (не’t существуют). я’LL держите вас в курсе, когда я найду больше информации об этом.
Защита от информации Microsoft: Оптическое распознавание персонажей (OCR) в Exchange Online и DLP Teams
Оптическое распознавание символов (OCR) поддержка извлечет текст из изображений и поможет обнаружить и защитить конфиденциальные данные на изображениях, которые используются в обмене онлайн (EXO), и политики по предотвращению данных (DLP) команды (DLP).
Дата предварительного просмотра: июнь CY2022
Продукт | Microsoft Информационная защита |
---|---|
Фаза высвобождения | Предварительный просмотр |
Дата выпуска | НА |
Платформа | Веб – |
Облачный экземпляр | По всему миру (стандартный мультитенант) |
Созданный | 2022-04-14 |
Дорожная карта идентификатор | 88860 |
Roadmap Link | https: // www.Microsoft.com/microsoft-365/дорожная карта?функция = 88860 |
Поделись этим:
- Нажмите, чтобы поделиться в Twitter (открывается в новом окне)
- Нажмите, чтобы поделиться на Facebook (открывается в новом окне)
- Нажмите, чтобы поделиться в Google+ (открывается в новом окне)