NumPy

NumPy
Логотип программы NumPy
Скриншот программы NumPy
Тип Python-библиотека[вд] и математическое ПО[вд]
Автор Трэвис Олифант
Разработчики Трэвис Олифант, Charles R. Harris[вд], Eric Wieser[вд], Pauli Virtanen[вд] и Matti Picus[вд]
Написана на Python, Си[2] и Фортран
Операционные системы Unix-подобная операционная система, macOS и Windows
Первый выпуск 1995
Последняя версия
Репозиторий github.com/numpy/numpy
Лицензия модифицированная лицензия BSD[вд][3]
Сайт numpy.org (англ.)​ (яп.)​ (порт.)
Логотип Викисклада Медиафайлы на Викискладе

NumPy (сокращенно от Numerical Python)— библиотека с открытым исходным кодом для языка программирования Python. Возможности:

Назначение

[править | править код]

Математические алгоритмы, реализованные на интерпретируемых языках (например, Python), часто работают гораздо медленнее тех же алгоритмов, реализованных на компилируемых языках (например, Фортран, Си, Java). Библиотека NumPy предоставляет реализации вычислительных алгоритмов (в виде функций и операторов), оптимизированные для работы с многомерными массивами. В результате любой алгоритм, который может быть выражен в виде последовательности операций над массивами (матрицами) и реализованный с использованием NumPy, работает так же быстро, как эквивалентный код, выполняемый в MATLAB[4].

Сравнение с MATLAB

[править | править код]

NumPy можно рассматривать как свободную альтернативу MATLAB. Язык программирования MATLAB внешне напоминает NumPy: оба они интерпретируемые, оба позволяют выполнять операции над массивами (матрицами), а не над скалярами. Преимущество MATLAB в наличии большого количества пакетов («тулбоксов»), например, Simulink[англ.]. Для NumPy тоже существуют подобные «пакеты», например, библиотека SciPy предоставляет больше MATLAB-подобной функциональности, библиотека Matplotlib позволяет создавать графики в стиле MATLAB. И MATLAB, и NumPy для решения основных задач линейной алгебры используют код, основанный на коде библиотеки LAPACK.

Рассмотрим пример работы с NumPy в интерактивной оболочке IPython.

Запуск iPython из командной строки:

ipython 

Код на языке Python, с использованием библиотек numpy и matplotlib:

import numpy as np import matplotlib.pyplot as plt  # функция y = sin(x) x = np.linspace(0, 2*np.pi, 100) y = np.sin(x) # нарисовать график в виде отдельных точек, в форме "o" plt.plot(x, y,"ro")  # сохранить рисунок в формат SVG  plt.savefig('matplotlib_sin_x_red_dots.svg')  # показать интерактивное окно с графиком plt.show() 

В результате выполнения кода на языке Python и использованием библиотек NumPy и Matplotlib будет создан график, приведённый на рисунке.

График функции sin(x), построенный с использованием библиотек NumPy и Matplotlib
График функции y=sin(x), построенный с использованием библиотек NumPy и Matplotlib

В 1995 году программист Jim Hugunin написал библиотеку Numeric для языка Python. Библиотека развивалась при участии многих людей, среди которых были Jim Fulton, David Ascher, Paul DuBois и Konrad Hinsen. Библиотека доступна по сей день, считается вполне стабильной и полной, но устаревшей.

Предлагалось добавить Numeric в стандартную библиотеку языка Python, но Гвидо Ван Россум (автор языка программирования Python) чётко дал понять, что код в его тогдашнем состоянии было невозможно поддерживать.

Кроме того, библиотека Numeric медленно обрабатывала большие массивы данных.

На основе библиотеки Numeric была создана библиотека NumArray. Код Numeric был полностью переписан.

Библиотека NumArray[5] обрабатывала большие массивы данных быстрее библиотеки Numeric, но малые массивы обрабатывала медленнее.

Некоторое время использовалась и библиотека Numeric, и библиотека NumArray. Последняя версия Numeric (v24.2) была выпущена 11 ноября 2005 года. Последняя версия NumArray (v1.5.2) вышла 24 августа 2006 года[6]. Библиотека NumArray более не рекомендуется к использованию[7].

В начале 2005 года программист Трэвис Олифант захотел объединить сообщество вокруг одного проекта и для замены библиотек Numeric и NumArray создал библиотеку NumPy. NumPy был создан на основе кода Numeric. Код Numeric был переписан так, чтобы его было легче поддерживать, и в библиотеку можно было добавить новые возможности. Возможности NumArray были добавлены в NumPy.

Изначально NumPy был частью библиотеки SciPy. Чтобы позволить другим проектам использовать библиотеку NumPy, её код был помещён в отдельный пакет.

Исходный код NumPy находится в открытом доступе. Существует большое количество документации. Имеется даже подробный «Путеводитель по NumPy»[8].

NumPy v1.3.0 выпущен 5 апреля 2009 года и поддерживает Python v2.6[9]. Поддержка Python v3 была добавлена начиная с версии 1.5.0.[10]

Библиотека NumPy v.1.26.0 выпущена 16 сентября 2023 года и поддерживает Python 3.12[11]. Особенностью данного релиза являются:

  • Поддержка Python 3.12.0
  • Совместимость с Cython 3.0.0
  • Использование системы сборки Meson
  • Обновлена поддержка архитектуры SIMD
  • Исправления для f2py, поддержка meson и bind(x)
  • Поддержка для обновленной библиотекки Accelerate BLAS/LAPACK

Версии Python, поддерживаемые в данном релизе: от 3.9 до 3.12.

Примечания

[править | править код]
  1. Release 2.1.2 — 2024.
  2. The numpy Open Source Project on Open Hub: Languages Page — 2006.
  3. https://github.com/numpy/numpy/blob/master/LICENSE.txt
  4. SciPy PerformancePython. Дата обращения: 25 июня 2006. Архивировано 3 апреля 2012 года.
  5. numarray: A New Scientific Array Package for Python. Дата обращения: 18 января 2024. Архивировано 18 января 2024 года.
  6. NumPy Sourceforge Files. Дата обращения: 24 марта 2008. Архивировано 3 апреля 2012 года.
  7. Numarray Homepage. Дата обращения: 24 июня 2006. Архивировано 9 июня 2021 года.
  8. Oliphant, Travis E. Guide to NumPy (неопр.). Архивировано 7 марта 2016 года.
  9. NumPy 1.3.0 Release Notes. Дата обращения: 18 января 2024. Архивировано 26 декабря 2023 года.
  10. NumPy 1.5.0 Release Notes. Дата обращения: 18 января 2024. Архивировано 22 ноября 2023 года.
  11. NumPy 1.26.0 Release Notes. Дата обращения: 18 января 2024. Архивировано 26 декабря 2023 года.

Литература

[править | править код]
  • Андреас Мюллер, Сара Гвидо. Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными = Introduction to Machine Learning with Python: A Guide for Data Scientists. — Вильямс, 2017. — 480 с. — ISBN 978-5-9908910-8-1, 978-1-449-36941-5.
  • Дж. Вандер Плас. Python для сложных задач. Наука о данных и машинное обучение = Python Data Science Handbook: Essential Tools for Working with Data. — Питер, 2017. — 576 с. — ISBN 978-5-496-03068-7.