Intel® Math Kernel Library 10.1
|
|
Intel® Math Kernel Library (Intel® MKL) обеспечивает выполнение высокооптимизированных многопоточных математических операций для научных, инженерных и финансовых приложений, требующих наибольшей производительности. |
||
|
|
|||
Доступна версия 10.1!
Список новых функций и улучшений, направленных на повышение производительности.
Здесь можно найти полный список поддерживаемых операционных систем, компиляторов и процессоров.
На сайте WhatIf.intel.com
вы найдете информацию об интересных новых технологиях, связанных с Intel MKL.
|
Характеристики |
Исключительная производительность на процессорах Intel®
С использованием математической библиотеки, оптимизированной для систем на базе процессоров Intel® Itanium®, Intel® Xeon®, Intel® Pentium® 4 и Intel® Core™2 Duo вы сможете достичь высочайшей производительности. Особое внимание было уделено оптимизации многопоточной производительности для четырехъядерных процессоров Intel® Xeon® и новых четырехъядерных процессоров Intel® Core™ i7. Показатели производительности Intel MKL могут конкурировать с аналогичными характеристиками других пакетов математического ПО при работе на процессорах других производителей.
Готовность к многоядерным архитектурам
Высочайший уровень масштабирования на многопроцессорных и многоядерных системах1
Используйте встроенную функцию параллелизма Intel MKL для автоматической реализации масштабирования в новейших четырехъядерных и двухъядерных системах, в том числе в системах на базе процессоров Intel® Xeon® 7400. Функции Intel MKL BLAS, векторной математики и быстрых преобразований Фурье выполняются в многопоточной среде с использованием технологии OpenMP* наряду с многими другими функциями.
Потокобезопасность
Все функции Intel MKL являются потокобезопасными. Имеется также версия Intel MKL без поддержки многопоточности.
Автоматическое обнаружение рабочих процессоров
Предусмотрена динамическая проверка, обеспечивающая выполнение процессорно-оптимизированного кода. Таким образом, ваше приложение будет функционировать с максимальной производительностью вне зависимости от используемой системы.
Поддержка интерфейсов C и Fortran
В отличие от ряда других математических библиотек, требующих наличия дополнительных программных продуктов для реализации интерфейсов C и Fortran, в Intel MKL поддержка этих интерфейсов предусмотрена изначально.
Поддержка всех типов процессоров Intel® в одном пакете
Библиотека Intel MKL включает поддержку архитектур Intel® Xeon®, Intel® Core™, Intel® Pentium 4, Intel® Itanium® в одном комплекте. Многие другие математические библиотеки требуют приобретения нескольких программных продуктов для поддержки различных процессоров.
Право на безвозмездное распространение
Вы можете распространять неограниченное количество библиотек Intel MKL с вашим программным обеспечением.
Поддержка на Форуме Intel® Premier Support
С каждой покупкой ПО Intel MKL вы получаете высококлассную техническую поддержку в течение одного года. В течение этого периода вы можете бесплатно загружать программные обновления, в том числе и новые версии продукта. Для получения более подробной информации посетите Центр регистрации Intel
. Кроме того, вы можете получить помощь от участников сообщества на форуме пользователей.
Форум пользователей
Обменивайтесь опытом с другими пользователями на Дискуссионном форуме Intel MKL
(модерируется корпорацией Intel)
Линейная алгебра - BLAS и LAPACK
Используйте оптимизированные под процессоры Intel функции BLAS и LAPACK, которые демонстрируют значительный прирост производительности по сравнению с другими реализациями. Intel MKL 9.1 совместима с новой версией LAPACK 3.1.
Линейная алгебра - ScaLAPACK
Intel MKL ScaLAPACK характеризуется значительно более высокой производительностью по сравнению со стандартной реализацией NETLIB.
Линейная алгебра- Средства решения разреженных матриц
Обрабатывайте большие разреженные линейные системы уравнений с помощью средства прямого решения разреженных матриц PARDISO Direct Sparse Solver – легкой в использовании и потокобезопасной программной библиотекой с эффективным распределением памяти, разработанной Базельским Университетом. Intel MKL также содержит итеративные средства решения сопряженных градиентов и FGMRES.
Быстрые преобразования Фурье (БПФ)
Выполняйте многомерные процедуры БПФ (с числом измерений от 1 до 7) с удобным современным интерфейсом C/Fortran. Библиотека Intel MKL поддерживает распределенные кластеры памяти с той же поддержкой прикладного интерфейса, позволяющей повысить производительность посредством распределения задач между большим количеством процессоров с минимальными усилиями. Библиотека Intel MKL также обладает совместимостью с интерфейсами FFTW 2.x и 3.0, что упрощает для пользователей FFTW подключение библиотек Intel MKL к их приложениям.
Библиотека векторной математики
Увеличьте производительность приложений, с помощью векторного использования математических функций, требующих высокой производительности (степенные, тригонометрические, экспоненциальные, гиперболические, логарифмические и т.д.).
Векторные генераторы случайных чисел
Увеличьте скорость моделирования с помощью векторных генераторов случайных чисел, которые характеризуются значительно более высокой производительностью по сравнению с альтернативными скалярными генераторами случайных чисел.
Тест LINPACK
Intel предоставляет бесплатные пакеты тестирования LINPACK, созданные с помощью библиотеки Intel MKL, чтобы помочь вам получить наиболее высокие результаты тестирования для ваших систем на базе архитектуры Intel®.
К началу страницы
В данной версии библиотеки Intel Math Kernel Library (Intel MKL 10.1) оптимизирована многопоточная производительность для новейших процессоров Intel® (Intel® Xeon® серии 7400, Intel® Core™). В библиотеке Intel MKL версии 10.0 была представлена новая многоуровневая архитектура, которая более эффективно поддерживает различные модели работы наших пользователей. В этой версии стандартная и кластерная версии библиотеки были объединены в единый комплект.
Оптимизация для новых процессоров Intel® Xeon® и Intel® Core™
Дополнительная информация представлена ниже в разделе “Повышение производительности в версии 10.1”.
В библиотеке Intel MKL версии 10.0 введена многоуровневая архитектура
В библиотеке Intel MKL версии 10.0 была изменена архитектура продукта, которая стала многоуровневой. Теперь базовый пакет Intel MKL поддерживает многочисленные конфигурации интерфейсов, компиляторов и процессоров в одном программном продукте. Многие другие поставщики библиотек предлагают специализированные версии, которые нужно сначала найти, потом загрузить, установить и протестировать на совместимость с конкретной конфигурацией вашей среды разработчика. Новая архитектура Intel MKL призвана обеспечить максимальную поддержку разнообразных требований клиентов и свести к минимуму затраты, необходимые для достижения и использования высокой производительности Intel MKL. Для получения более подробной информации см. раздел «Использование параллелизма в Intel MKL» Руководства пользователя Intel MKL.
Вычислительный уровень
Этот уровень образует ядро библиотеки Intel MKL. В ходе выполнения процессорной части оптимизированного кода производится проверка времени нахождения системы в рабочем состоянии. Пользователи могут создавать объекты с особым уровнем распределения доступа и включать в них только необходимую часть кода, уменьшая тем самым размер этого уровня, если это критично.
PARDISO* – Средство параллельного прямого решения разреженных матриц
Использование внешней памяти для решения крупных задач в системах SMP
Поддержка отдельной замены в направлении вперед и назад в DSS/PARDISO.
Новый параметр для выключения повторяющегося улучшения интерфейса DSS.
Для интерфейса PARDISO введен новый параметр проверки структуры разреженных матриц.
Теперь функции решения разреженных матриц интегрированы в главную математическую библиотеку, и ссылки на отдельную библиотеку больше не нужны.
Ссылки на решение разреженных матриц теперь вставляются динамически.
Разреженные матрицы BLAS
Добавлены процедуры расчета суммы и произведения двух разреженных матриц, сохраненных в сжатом формате
Добавлены процедуры преобразования разных форматов разреженных матриц.
Добавлена поддержка всех типов данных (одинарная точность, комплексные, двойные комплексные).
Добавлено индексирование разреженной матрицы на базе нулей
Добавлена поддержка вычислений с одинарной точностью
Средства решения разреженных треугольных матриц 3 уровня разделены на потоки
LAPACK
Добавлена возможность отслеживать выполнение и прерывать длительные вычисления LAPACK с помощью функции обратного вызова. Функция mkl_progress может быть определена в пользовательском приложении, которое может регулярно вызываться из поднабора процедур MKL LAPACK. Информацию о том, какие функции LAPACK поддерживают эту возможность, можно найти в описании функций.
Интерфейс дискретных преобразований Фурье (DFTI)
Функция DftiCopyDescriptor добавлена для удобства при использовании быстрых преобразований Фурье.
Размер статистически связанных исполняемых элементов DFTI был значительно уменьшен.
Теперь для преобразований действительных чисел доступно комплексное хранилище.
Оператор предобусловливания для итеративного средства решения
Ускоритель/оператор предобусловливания ILUT для итеративных средств решения Intel MKL RCI
Функции векторной математики
Новые функции Mul, Conj, MulbyConj, CIS, Abs
Новый режим «Повышенная производительность». Режим ПП предназначен для приложений, где неточности выполнения математических функций не являются критичными по сравнению с некорректными параметрами (как, например, при моделировании по методу Монте-Карло или работе с мультимедийными приложениями)
Все функции VML теперь реализуются в многопоточной среде
В библиотеку векторной математики добавлены оптимизированные функции CdfNorm, CdfNormInv и ErfcInv.
Руководство пользователя
Руководство пользователя Intel MKL претерпело ряд существенных изменений и дополнений. Это незаменимое средство при работе с Intel MKL. Для загрузки руководства или просмотра онлайн перейдите на страницу Документации
Поддержка компиляторов
Поддержка новых компиляторов, в том числе новых компиляторов Intel® версии 11.0 и компиляторов PGI.
Оптимизация производительности затронула все компоненты библиотеки. Ниже представлены некоторые цифры, касающиеся повышения производительности. Список улучшений в области производительности в последних версиях Intel MKL представлен на странице «Улучшение производительности». Улучшения производительности показаны в соответствующих разделах области по каждому продукту (BLAS/LAPACK, FFT, VML, и т.д.).
BLAS
o Улучшения 32-разрядных приложений
§ Улучшение производительности до 50% для (Z,C)GEMM на четырехъядерных процессорах Intel® Xeon® серии 5300
§ Улучшение производительности на 10% для всего кода (D,S,Z,C)GEMM на четырехъядерных процессорах Intel® Xeon® серии 5400
o Улучшения 64-разрядных приложений
§ Улучшение производительности SGEMM на 50% на процессорах Intel® Core™ i7.
§ Улучшение производительности правых примеров DTRSM на 30% на процессорах Intel® Core™ i7.
Средство прямого решения разреженных матриц (DSS/PARDISO):
o Улучшение производительности в среднем на 35% при использовании внешней памяти PARDISO.
VML и VSL
o Оптимизация для процессоров Intel® Core™ i7:
§ Улучшение производительности до 17% для следующих функций VML: Asin, Asinh, Acos, Acosh, Atan, Atan2, Atanh, Cbrt, CIS, Cos, Cosh, Conj, Div, ErfInv, Exp, Hypot, Inv, InvCbrt, InvSqrt, Ln, Log10, MulByConj, Sin, SinCos, Sinh, Sqrt, Tanh.
§ Улучшение производительности до 67% для стандартной генерации случайных чисел.
§ Улучшение производительности генераторов дистрибутивов VSL на базе Wichmann-Hill, Sobol и Niederreiter BRNG (только 64-разрядная версия) до 10%.
BLAS
Функционирование DGEMM в многопоточной среде было улучшено для средних и малых размеров - внешнее векторное произведение на 10%, квадрат величины на 80%
Квадрат величины и внешнее векторное произведение для крупных величин DGEMM/SGEMM на 1 поток возросли на 4-5%, на 8 потоков – на 10-15%.
Показатели DTRSM, DTRMM и DSYRK были улучшены на 5-30%
Остальные действительные функции 3 уровня для крупных величин были улучшены на 2-4%.
LAPACK
Значительно улучшилось быстродействие некоторых средств решения линейных уравнений (spsv/hpsv/ppsv, pbsv/gbsv, gtsv/ptsv, sysv/hesv). В некоторых случаях при обработке ленточного или упакованного форматов хранения данных или множественных правых частей матриц наблюдается прирост в скорости до 100 раз.
Благодаря почти четырехкратному ускорению операции тридиагонализации (sytrd/hetrd) значительно возросла скорость работы всех симметричных собственных средств решения (syev/syev, syevd/heevd, syevx/heevx, syevr/heevr).
Для всех симметричных собственных средств решения в упакованном формате (spev/hpev, spevd/hpevd, spevx/hpevx) скорость также значительно возросла, благодаря почти трехкратному ускорению операции тридиагонализации в упакованном формате (sptrd/hptrd).
Кроме того, практически вдвое выросло быстродействие операций с ортогональными/унитарными транформациями (ormqr/unmqr, ormrq/unmrq, ormql/unmql, ormlq/unmlq).
БПФ
Производительность сложных одномерных БПФ для величин, кратных двум, была увеличена почти в 1,8 раз на 1 потоке.
В системах на базе архитектуры Intel® 64, работающих в 64-разрядном режиме, одиночные сложные обратные одномерные БПФ размером более 2^22 на процессорах Intel® Itanium® были ускорены до 2 раз на 4 потоках и до 2,4 раз на 8 потоках.
VML/VSL
Производительность функций VSL на процессорах других производителей повысилась в среднем примерно в 2 раза
Производительность функций VML vdExp, vdSin и vdCos на процессорах других производителей повысилась в среднем на 18%
Производительность функций VSL в процессорах на базе архитектур IA-32 и Intel® 64 была увеличена примерно на 7%
Операционные системы
Библиотека Intel MKL 10.1 поддерживает Linux*, Windows* (в том числе HPC Server 2008) и Mac OS* X. Поддерживаются следующие версии Linux: Red Hat*, Suse*, Debian*, Ubuntu*, Asianux* и прочие варианты Linux Standard Base 3.1. Полный список приведен на странице Системные требования.
Среды разработки
Среды разработчиков Intel IPP легко использовать и интегрировать в такие популярные среды разработки, как Microsoft Visual Studio*, Xcode*, Eclipse* и набор компиляторов GNU (GCC).
Процессоры
Версия Intel MKL 10.1 поддерживает все процессоры на базе архитектуры Intel и специально оптимизирована для следующих процессоров:
Процессоры семейства Intel® Xeon®
Процессоры семейства Intel® Core™
Процессоры семейства Intel® Itanium®
Процессоры семейства Intel® Pentium®
Процессоры семейства AMD Opteron* и Athlon*
Полный список приведен на странице Системные требования.
Информация взята с оффициального сайта Intel

