Четыре стадии, которые преследуют нас везде: в бизнесе, карьере, проектах и запуске продуктов. Читайте в партнёрском материале в блоге Krouglov on stage NewTechAudit — свежее
Добавить обложку
Подписан
Отписаться

NewTechAudit

Лайфхаки IT, проверенные AI-решения для стандартных задач

723 подписчика

Машинное обучение в Power BI на Python

Машинное обучение в Power BI. Звучит довольно необычно, правда? С недавних пор в Power BI реализовано машинное обучение на AutoML, однако воспользоваться этим функционалом могут не все пользователи. Так давайте же разберемся с тем, как обойти это ограничение с помощью Python.

Рис. 1 Исходные данные для машинного обучения

Машинное обучение: с чего начать, или как построить первую модель

Никогда не задумывались, что влияет на цену недвижимости? Рассказываем, как построили первую модель машинного обучения и проанализировали ее качество.

Полезные оконные функции SQL

Можно бесконечно долго «воротить нос» от использования SQL для Data Preparation, отдавая лавры змеиному языку, но нельзя не признавать факт, что чаще мы используем и еще долго будем использовать SQL для работы с данными, в том числе и очень объемными.

Настройка нейросети для детекции объектов

Обучать нейросеть — долгий и затратный по вычислительным ресурсам процесс. Как сделать его проще, расскажем далее на примере переобучения нейросети по детекции определенного объекта на изображении.

Граф процесс в тринадцать строчек

Экспертный анализ процесса – очень дорогая компания. Требуется много ресурсов и времени. Но есть автоматизированные способы, которые может применить любой.

Когда бизнес только начинает свой путь. Процессы его свежи и понятны всем участникам, включая менеджмент. С течением времени бизнес начинает расти и как следствие – начинают расти процессы внутри него. Такая деформация, от эталонного состояния, просто необходима, чтобы соответствовать потребностям бизнеса. Как только процесс разрастается…

Биометрия: «подводные камни»

Сбор и обработка биометрических параметров регулируются на законодательном уровне. Понятие «биометрические персональные данные» как отдельной категории персональных данных содержится в Федеральном законе № 152-ФЗ. В связи с этим у организации, использующей биометрию для идентификации клиентов, могут возникать регуляторные риски, связанные с…

Кластеризация данных на примере метода к-средних

Кластеризация — подзадача Data Mining, которая группирует множество объектов на подмножество таким образом, чтобы объекты одного кластера были максимально похожи друг на друга, а объекты из разных кластеров имели максимальное количество отличных друг от друга критериев. Так в сфере аудита, кластеризация поможет определить выпадение транзакций…

Скажи «НЕТ!» ручному труду. Автоматизация запуска, расчета периодов и рассылки

Автоматизация отчетности сейчас в тренде. Но мало кто задумывается, что можно автоматизировать не только отдельные этапы составления отчетов, но и полностью убрать ручной труд! Не нужно запускать построение отчета, указывать входные данные и даже делать рассылку?

Алгоритм балансировки классов Smote

Во время обучения модели столкнулись с несбалансированными данными? Расскажем вам об инструменте, который поможет решить данную задачу.

Расстояние Левенштейна для поиска опечаток в данных клиента

В процессе работы часто встречаются задачи сравнения, казалось бы, похожих данных. Например, клиенты с одинаковыми паспортными данными, но немного отличающимися ФИО. Как понять, где была допущена ошибка: в ФИО (то есть мы имеем одного и того же клиента) или в серии и номере паспорта?

Приглашаем к участию!

Статистика и никакого мошенничества

Часто сталкиваетесь с необходимостью визуализировать данные c помощью сводных таблиц и т.д.? А что если N число строк — это сухо и скучно? В этом случае необходима визуализация при помощи графиков и диаграмм. А что делать, если результаты гипотезы не совпадают с «ожиданием»? О том, как аудитору разобраться в фиктивной статистике читайте в нашей…

Прямой эфир