Публикации по теме 'data-analysis'


BioVinci: инструмент перетаскивания для визуализации данных
Ежедневно появляются огромные объемы биологических данных, ожидающих своей расшифровки. Практически невозможно их проанализировать и визуализировать без написания сложного кода. Как биолог, возможно, вы не сочтете оптимальным использовать свое время для разработки такого кода с нуля. Вот почему мы создаем BioVinci , мощный, но простой инструмент для анализа и визуализации данных. BioVinci позволяет биологам из влажных лабораторий и биомедицинским исследователям обрабатывать..

10 мощных методов уменьшения размеров в машинном обучении
Сокращение измерений — это процесс уменьшения количества входных переменных (размеров) в наборе данных при сохранении наиболее важной информации. Он включает в себя преобразование многомерного набора данных в низкоразмерное представление, которое захватывает как можно больше исходных данных. Хотите повысить эффективность и точность своих моделей машинного обучения? Методы уменьшения размеров могут помочь. В этой статье мы рассмотрим 10 мощных методов уменьшения размерности,..

Project Data Science, запись в блоге — данные учащихся.
Введение Этот проект представляет собой сообщение в блоге для специалиста по данным Nanodegree из Udacity. Я работал над набором данных о студентах , содержащим 480 студентов, состоящим, например, из (пол, национальность, место рождения, семестр). Поэтому я задам несколько хороших вопросов и отвечу на них, используя библиотеки Python (scikit-learn, pandas, NumPy, matplotlib), а затем создам модель машинного обучения, чтобы предсказать итоговую оценку учащегося по конкретному курсу...

Использование моделей машинного обучения в прогнозировании продаж для Corporación Favorita
Прогнозирование продаж всегда сложно, но, тем не менее, необходимо, поскольку ключевым фактором эффективности розничной торговли компании является способность правильно оценивать продажи и управлять запасами. Ключевой проблемой в этом случае является прогнозирование потребностей в продажах и запасах для каждого места, чтобы избежать затоваривания или нехватки товаров, что позволяет бизнесу предлагать наилучшее обслуживание клиентов, сокращая потери и гарантируя устойчивость магазина...

День 15: Деревья решений и случайные леса
Python для науки о данных Добро пожаловать на 15-й день нашего конкурса Python для науки о данных! Деревья решений и случайные леса — это мощные алгоритмы, широко используемые для задач классификации и регрессии. Сегодня мы изучим принципы деревьев решений и случайных лесов, узнаем, как строить модели дерева решений в Python, и поймем концепцию ансамблевого обучения и важность функций. Деревья решений и случайные леса предлагают надежные возможности прогнозирования и являются важными..

Понимание роли статистики в аналитике данных
Аналитика данных — это процесс изучения, очистки, преобразования и моделирования данных для обнаружения полезной информации, получения выводов и поддержки принятия решений. Он стал краеугольным камнем современного бизнеса, здравоохранения, финансов и многих других областей. В основе анализа данных лежит статистика, которая предоставляет необходимые инструменты и методы для понимания данных. В этой статье мы углубимся в роль статистики в анализе данных, изучим ее значение, ключевые..

Time to Insight: критическая метрика в аналитике данных
Данные являются жизненно важным активом, который организации используют для принятия обоснованных решений. С огромными объемами данных, генерируемых каждый день, извлечение значимой информации важнее, чем когда-либо. Именно здесь в игру вступает концепция «Время озарения». Что такое время для озарения? Time to Insight — это метрика, которая представляет количество времени и усилий, необходимых аналитику для извлечения полезных и действенных идей из набора данных. Другими словами,..