Публикации по теме 'data-analysis'
10 лучших функций dplyr - простой анализ данных
Dplyr проще и чище, чем Pandas. Вы смеете переключиться?
Я был фанатом Python последние пару лет. Этот язык отлично подходит для науки о данных, и, будучи языком общего назначения , значительно упрощает работу с частями науки о данных, не связанных с наукой о данных. Но может ли R dplyr превзойти Python pandas в области исследования и подготовки данных? Да, может.
Сегодня мы увидим, как использовать 10 самых распространенных dplyr функций. Это еще не все, что может..
5 шагов в разработке модели машинного обучения.
5 шагов в разработке модели машинного обучения.
Машинное обучение (ML), часть искусственного интеллекта (ИИ). Существует пять общих шагов для разработки модели машинного обучения (ML).
Шаг 1 : Подготовка данных — Сбор данных и предварительная обработка
Данные — это мастер модели машинного обучения. Подготовка данных является ключевым этапом построения модели машинного обучения. Подготовка данных состоит из двух процессов: сбор данных и предварительная обработка. Процесс сбора..
Техническое письмо 101: Полное техническое руководство
Сложная техническая информация иногда может быть слишком сложной для нетехнического пользователя. В результате пользователь может пропустить важную информацию или, в случае с руководством, пользователь может в конечном итоге сделать что-то не так. Это может быть неприятно, и можно отказаться от выполнения задачи, если поблизости нет технического специалиста, который мог бы перевести для них. Поэтому эта информация должна быть изложена на простом языке, который пользователи понимают и могут..
Расчет корреляции между переменными данных
Во многих реальных проектах по науке о данных мы обнаруживаем наличие сложных и неизвестных взаимосвязей между переменными данных. Это становится более критической ситуацией из-за меньшего знания предметной области. Знание этих взаимосвязей помогает лучше понимать данные и соответствовать лучше смоделированным алгоритмам машинного обучения.
В одной из наших статей мы видели, что такие алгоритмы, как линейная регрессия, ухудшают производительность из-за существования..
Сколько мне нужно программирования в области науки о данных?
Наука о данных , Программирование
Сколько мне нужно программирования в области науки о данных?
Наука о данных - это не информатика. Сосредоточьтесь на использовании существующих библиотек и пакетов. Имейте некоторое представление о математике, стоящей за каждым пакетом.
Введение
Если вы соискатель науки о данных, у вас, несомненно, есть следующие вопросы:
Могу ли я стать специалистом по обработке данных, практически не имея опыта программирования?
Какие основные..
Разница в аналитике данных в бизнесе и инженере (часть I)
Поскольку каждый день генерируется все больше и больше данных, аналитика данных играет важную роль в различных отраслях. Однако в каждой области есть разные способы, каналы и затраты на получение и хранение данных, поэтому их процессы анализа данных сильно различаются. В этом блоге будут описаны две распространенные процедуры анализа данных: анализ данных на основе транзакций и анализ данных на основе датчиков.
Анализ данных на основе датчиков
В производственных отраслях..
Анализ и прогнозирование использования арендованных велосипедов в блоках данных
Анализ и прогнозирование использования арендованных велосипедов в блоках данных
Использование велосипедов напрокат становится все более распространенным явлением. Я попытался использовать Databricks, чтобы провести анализ и угадать данные об использовании прокатного велосипеда. Я выполнял анализ данных в Python и машинное обучение в R на одном ноутбуке. Данные взяты из Kaggle . В нем есть количество используемых велосипедов в час, погодные условия, рабочий день или нет и т. д...
Новые материалы
10 лучших функций dplyr - простой анализ данных
Dplyr проще и чище, чем Pandas. Вы смеете переключиться?
Я был фанатом Python последние пару лет. Этот язык отлично подходит для науки о данных, и, будучи языком общего назначения ,..
Практики безопасного кодирования: защитите свой код от распространенных уязвимостей
В постоянно меняющейся среде разработки программного обеспечения написание безопасного кода имеет первостепенное значение для защиты приложений и конфиденциальных пользовательских данных от..
Контакт:
⋆⋆⋆ PREDICTIVE ANALYTICS AND CUSTOMER SEGMENTATION: THE FUTURE OF MARKETING ⋆⋆⋆
Authored by Gerard King
Контакт:
Электронная почта:..
5 шагов в разработке модели машинного обучения.
5 шагов в разработке модели машинного обучения.
Машинное обучение (ML), часть искусственного интеллекта (ИИ). Существует пять общих шагов для разработки модели машинного обучения (ML)...
НОВЫЙ КУРС — Введение в управляемый сервером пользовательский интерфейс в Swift
Что, если есть способ мгновенно обновить пользовательский интерфейс вашего приложения, не отправляя новую версию?
Такие компании, как Airbnb, Spotify, Flipkart, Swiggy и некоторые другие,..
«Что такое машинное обучение и его влияние на следующее поколение?»
«Прорыв в машинном обучении стоил бы десяти Microsoft». — Билл Гейтс, бывший председатель Microsoft
Позвольте мне объяснить вам, что это просто. Точно так же дети учатся ходить. Каждый..
SyntaxError: EOL при сканировании строкового литерала
Забыл закрыть строку кавычками в python
В моем случае эта ошибка была слишком сложным способом сказать: «Вы забыли закрыть строку соответствующей двойной или одинарной кавычкой».
EOL означает..