Как настроить Джулию для науки о данных

Краткий обзор шагов, необходимых для правильной настройки Julia для Data Science на вашем компьютере.

Введение

Язык программирования Julia — относительно молодой язык, который в последние годы покорил мир Data Science. Это связано с тем, что функции языка Julia очень хорошо облегчают научные вычисления и машинное обучение. Это из-за жесткого сочетания числовой точности, скорости вычислений и научного синтаксиса. Учитывая все эти атрибуты языка, легко понять, почему любой специалист по анализу данных может задуматься о выборе языка программирования. Однако, выбирая язык, вы, вероятно, столкнетесь с самой большой проблемой, связанной с языком программирования Julia, с его популярностью.

По сравнению с большинством других языков программирования, Julia имеет очень низкий уровень принятия и гораздо меньшую пользовательскую базу и экосистему пакетов, чем большинство других статистических языков, с которыми она конкурирует. Это может значительно затруднить изучение языка только потому, что доступно гораздо меньше ресурсов. Более того, если некоторым пользователям слишком сложно даже заставить язык работать должным образом на их машинах, маловероятно, что эти пользователи будут хорошо знакомы с языком, помимо того, что есть на веб-сайте.

Установка Юлии

Конечно, в этом отношении первым шагом к настройке Джулии будет фактическая установка языка программирования. Конечно, этот процесс будет кардинально отличаться в зависимости от того, какую операционную систему вы используете. В большинстве unix-подобных операционных систем, таких как MacOS, Linux и FreeBSD, пакет будет доступен в вашем диспетчере пакетов. Однако я хотел бы отметить, что, вероятно, вам не следует устанавливать язык Julia в этих системах таким образом. Это связано с тем, что эти версии диспетчера пакетов часто сильно устарели, и в некоторых случаях вы можете получить старую и по сути бесполезную версию Julia. Даже в сценариях, где версия выше последней версии 1.0, вы можете обнаружить, что многие функции упущены, а документация может быть неточной. Более того, когда дело доходит до работы с пакетами в экосистеме, совместимость всегда вызывает большую озабоченность.

В этих Unix-подобных системах я определенно рекомендую загрузить язык прямо с веб-сайта Julia. В этом отношении первым шагом, вероятно, будет загрузка файла и его размещение в желаемом каталоге. Обычно я делаю это с помощью wget в bash, но, по сути, нет никакой разницы между тем, как это делать в веб-браузере или в терминале. После загрузки и извлечения пакета следующим шагом будет добавление пути к вашей системе, чтобы ваша система знала, где на самом деле находится ваша установка Julia. В Linux мы можем сделать это, отредактировав наш файл ~ / .bashrc или ~ / .bash_profile.

wget https://julialang-s3.julialang.org/bin/linux/x64/1.6/julia-1.6.0-linux-x86_64.tar.gz tar zxvf julia-1.6.0-linux-x86_64.tar.gz

Теперь мы добавим эту строку в наш ~ / .bashrc

export PATH=»$PATH:/julia/directory»

Я обычно помещаю его вместе с моим общесетевым ассемблером в / opt, но вы можете разместить его где угодно в корневой файловой системе.

Что касается установки на MacOS, процесс начинается с файла Julia dmg, представленного на веб-сайте. При желании вы можете добавить вызов в PATH с помощью ln:

ln -s /Applications/Julia-1.6.app/Contents/Resources/julia/bin/julia /usr/local/bin/juli

Для Windows мы, конечно же, запустим исполняемый файл .exe, как вы обычно делаете это с любым приложением в этой операционной системе. После этого вы можете добавить PATH, как и раньше. Конечно, это немного отличается от командного терминала NT на базе MSDOS, который вы получаете в Windows. Процесс добавления этого в PATH в Windows выглядит примерно так:

  1. Откройте «Выполнить» (Windows Key + R), введите rundll32 sysdm.cpl,EditEnvironmentVariables и нажмите Enter.
  2. В разделе «Пользовательские переменные» или «Системные переменные» найдите строку с «Путь» и нажмите «Изменить».
  3. Появится пользовательский интерфейс «Изменить переменную среды». Здесь нажмите «Создать» и вставьте в каталог, указанный на этапе установки. Это должно выглядеть примерно так: C:UsersJohnDoeAppDataLocalProgramsJulia 1.6.0bin.
  4. Щелкните ОК. Теперь вы можете запустить Джулию из командной строки, набрав julia!

Среды разработки

Когда дело доходит до сред разработки с Джулией, есть много разных вариантов, которые я лично считаю потрясающими.

Ноутбуки

Во-первых, в мире ноутбуков у нас есть три варианта:

  • IJulia.jl
  • Pluto.jl
  • Neptune.jl

Все это пакеты Julia, которые нам нужно будет добавить, поэтому для того, чтобы запустить сервер ноутбука, мы могли бы сначала выяснить, какой сервер ноутбука будет наиболее подходящим для нашей работы. Лично я предпочитаю старый добрый Юпитер Плутону и Нептуну, что, как я считаю, может быть немного головной болью и иметь приличный путь, когда дело доходит до реальной стабильности и хорошей работы. Я написал самоуверенную статью именно по этой теме, которую вы можете проверить здесь, чтобы узнать, подходит ли вам Pluto.jl:

 

Может ли Pluto стать настоящей заменой Jupyter?
Краткий обзор и сравнение блокнотов Pluto.jl и других решений для разработки программ на Julia… todatascience.com

 

При этом преимущество использования таких решений, как Pluto или Neptune, заключается в том, что оба этих сервера ноутбуков написаны на языке программирования Julia. Другими словами, мы можем исключить посредника с ядрами IPython и запустить Julia непосредственно через себя, что, безусловно, может дать некоторые преимущества в производительности. Кроме того, файлы Pluto и Neptune хранятся в файлах .jl Julia, а не в файлах записной книжки IPython — что довольно круто, потому что тогда вы можете написать свой код один раз и заставить его работать как из REPL, так и из записной книжки.

Напомним, Neptune.jl — это довольно недавно выпущенная модификация Pluto.jl. Реализация Neptune.jl на самом деле избавляет от многих проблем, которые у меня были с Pluto.jl. Эти примеры включают интерактивность, которая иногда может быть даже немного агрессивной и мешать вам и написанию кода. IJulia — это просто ядро ​​Jupyter для Джулии, которое для меня было наиболее эффективным решением с учетом моих личных предпочтений. При этом нет ничего плохого в том, чтобы попробовать это.

Имея это в виду, все, что нам действительно нужно сделать для работы с этими пакетами, — это добавить их через диспетчер пакетов Джулии, Pkg. Это, конечно, за исключением IJulia, которому для правильной работы потребуется установка Jupyter. Чтобы добавить эти пакеты, нам сначала нужно попасть в Julia REPL. Вы можете сделать это универсально во всех операционных системах, набрав «julia» в терминале или в командном окне. Как только вы войдете в Julia REPL, вы можете нажать], чтобы войти в Pkg REPL. Хотя сам по себе Pkg — это пакет, который вы всегда можете вызвать от Джулии, я определенно предпочитаю использовать этот метод. Теперь мы можем использовать команду add с пакетом в качестве аргумента для добавления наших пакетов:

julia > ] pkg > add IJulia pkg > add Pluto pkg > add Neptune

С IJulia ядро ​​Julia теперь должно появиться в вашем списке ядер в Jupyter, и это действительно все, что нужно сделать. С Нептуном и Плутоном вам нужно будет импортировать пакет и использовать функцию run (), чтобы запустить свой сервер.

using Neptune; Neptune.run() using Pluto; Pluto.run()

Текстовая IDE

Помимо портативного сервера вам может потребоваться среда разработки для обычного текста. Для этого мне больше всего нравится Atom с Juno. Однако есть также среда разработки VSCode, которую я никогда не использовал. На самом деле Juno является технически устаревшим — ну, не устаревшим, но единственные обновления, которые он получает, — это исправления безопасности и ошибок, никаких новых функций не планируется добавлять в пакет Juno. Как и большинство экземпляров пакетов Atom, вы можете установить его, сначала зайдя в строку меню и выбрав ›изменить настройки.

Это вызовет меню предпочтений. В левой части этого меню вы должны увидеть небольшой знак плюса с надписью «установить», там вы можете установить Juno. Это также установит пакет Juno.jl и бум! Теперь вы можете редактировать текст Джулии!

Среды

Последнее, что может понадобиться для работы с языком Julia, — это возможность работать с виртуальными средами. В Julia этот процесс невероятно прост и полностью выполняется через менеджер пакетов Pkg. Мы можем вызвать команду или метод активации из Pkg, чтобы создать новую виртуальную среду. Это создаст папку с файлом Project.toml внутри. Этот файл проекта будет содержать все зависимости для вашего проекта и имеет форму типичного файла конфигурации.

julia > ] pkg > activate env

Вывод

Популярность языка Julia, безусловно, резко возросла за последние год или два. Это связано со всеми функциями, ориентированными на Data Science, доступными в языке, поскольку в последнее время Data Science стала довольно популярной темой в мире вычислений. Я думаю, что с этим новым набором пользователей многие будут потеряны только в процессе установки. Имея это в виду, я надеюсь, что эта статья успешно решила эту проблему — и если бы этой проблемы никогда не было, возможно, это вызвало бы небольшой интерес к языку! Что в этом хорошего, так это то, что теперь вы знаете, как его установить!

Источник: ledsshop.ru

Стиль жизни - Здоровье!