Есть несколько способов стать специалистом по данным, и один из них — полагаться на механическое сочувствие. Вы должны понимать, как работает модель ML. Чтобы понять, как это работает, вы можете задать несколько начальных вопросов: (1) используется ли это для классификации или регрессии? (2) как мне подготовить набор входных данных (3) какие статистические допущения для набора входных данных должны быть соблюдены? (4) Является ли масштабирование данных обязательным или необязательным — и почему? Теперь вы можете с комфортом получить эти ответы в интерактивном режиме.

Ответы на эти вопросы стали легко усваиваться с помощью ChatGTP, где вы можете задать один и тот же вопрос несколькими способами, чтобы получить разъяснение, которое имеет для вас больше смысла. Я лично заметил, что при чтении книг или научных работ по машинному обучению или статистическому анализу легче понять теорию и то, о чем идет речь, после того, как я задам уточняющие вопросы в ChatGPT — бесплатной общедоступной версии.

Механическое сочувствие: «Чтобы стать гонщиком, вам не обязательно быть инженером, но вам нужно иметь механическое сочувствиеДжеки Стюарт, автогонщик.

Для этого небольшого проекта моим главным вопросом было — как мне подготовить набор данных?

Я никогда не использовал LSTM и не готовил для него данные, поэтому ChatGPT помог мне с нуля до чего-то.

Мой процесс:

Первое, что я сделал, — это понял набор данных и проблему, с которой работал — предсказание погоды по временным рядам. Я попросил лучший алгоритм машинного обучения для долгосрочного прогноза погоды. Ответ, который я получил, был отличным, потому что я прочитал о различных методах, которые я мог изучить.

ЧатGPT А:

Авторегрессионное интегрированное скользящее среднее (ARIMA): модели ARIMA являются популярным выбором для моделирования данных временных рядов. Они могут фиксировать тенденции, сезонные закономерности и циклическое поведение данных, что делает их полезными для прогнозирования погоды.

Долгосрочная кратковременная память (LSTM): LSTM — это тип рекуррентной нейронной сети (RNN), которую можно использовать для прогнозирования временных рядов. Это особенно эффективно при работе со сложными и нелинейными закономерностями в данных.

Сверточные нейронные сети (CNN): CNN — это еще один тип нейронной сети, который можно использовать для прогнозирования временных рядов. Они работают, извлекая функции из входных данных и используя эти функции для прогнозирования.

Сезонная авторегрессионная интегрированная скользящая средняя (SARIMA): модели SARIMA представляют собой вариант ARIMA, который может обрабатывать сезонные закономерности в данных. Они особенно полезны для прогнозирования данных о погоде, которые демонстрируют четкие сезонные закономерности.

Prophet: Prophet — это модель прогнозирования временных рядов, разработанная Facebook, которая особенно эффективна для прогнозирования данных с множественной сезонностью и сильными тенденциями. Он использует комбинацию моделей линейной и нелинейной регрессии для прогнозирования.

И другие — как регрессия хребта. Я случайно выбрал LSTM.

Следующие основные вопросы касались (1) того, как структурировать и преобразовывать данные для модели LSTM (2) и как кодировать базовую модель LSTM, чтобы начать обучение. ChatGPT работает лучше всего, если вы подробно описываете свою проблему, иначе вы получите очень общие нечеткие ответы. После нескольких попыток я наконец понял, что делать.

1- Опишите данные и проверьте на понимание, заявив «ChatGPT, вы понимаете»

2- Опишите переменную результата,

3- Задайте уточняющие вопросы,

а. Вы также можете задать вопрос, поясняющий ошибку кода — пока это работало лучше, чем переполнение стека.

4- И повторите процесс, потому что чем больше вы повторяете вопрос, разъяснение, процесс реализации, тем лучшие результаты вы получите от ChatGPT.

См. пример ниже

В. У меня есть набор данных с 731 днем ​​и 514 местоположениями — понятно?

В. Мне нужно предсказать температуру для каждого заданного местоположения и даты с помощью LSTM.

Q. Моя форма данных в настоящее время (375734, 210). как я могу изменить его на (514, 731, 210)

В. Учитывая приведенную выше информацию, как мне настроить LSTM?

После нескольких попыток это базовая модель, с которой я столкнулся:

Таким образом, ChatGPT — отличный помощник, но мне все же пришлось потратить некоторое время на чтение о временных рядах и LSTM, чтобы изменить и предоставить правильные подсказки для ChatGPT.