Browse
Добавление точек просмотра данных в поток для проверки и верификации данных в любом месте процесса.
Позволяет пользователям просматривать данные на любом этапе обработки.
Filter
Запрос записей по условию с разделением данных на два потока: True (соответствуют условию) и False (не соответствуют).
Оставить только клиентов с более 10 транзакциями или определённым уровнем продаж.
Formula
Создание или обновление полей с помощью одного или нескольких выражений для выполнения широкого спектра вычислений.
Замена NULL-значений нулями. Поддерживает все формулы Excel и многое сверх того.
Input
Загрузка данных в модуль путём выбора файла или подключения к базе данных (опционально с запросом).
Подключение к разнородным наборам данных различных форматов.
Join
Объединение двух входных потоков по общему полю. Функция аналогична SQL JOIN, создаёт 3 выхода: L (только левый), J (совпадения), R (только правый).
Объединение профиля клиента с транзакционными данными по уникальному ID клиента.
Output
Вывод содержимого потока данных в файл или базу данных.
Загрузка обогащённых данных обратно в базу данных.
Sample
Ограничение потока данных до заданного числа, процента или случайного набора записей.
Выбор первых 10 записей для каждого региона — топ-10 магазинов по регионам.
Select
Выбор, отмена выбора, переупорядочивание и переименование полей, изменение типа или размера поля.
Если workflow требует 5 из 50 полей — отмените выбор остальных для ускорения обработки.
Sort
Сортировка записей по значениям одного или нескольких полей.
Ранжирование клиентов по сумме расходов в порядке возрастания/убывания.
Summarize
Агрегация данных путём группировки, суммирования, подсчёта, пространственной обработки, конкатенации строк и многого другого.
Количество клиентов в штате NY и общая сумма их расходов.
Comment
Добавление аннотаций или изображений на холст для заметок или описания процессов.
Документирование определённой части анализа для понимания другими пользователями.
Union
Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.
Объединение данных о продажах за март и апрель в единый поток для дальнейшей обработки.
Date Time Now
Ввод текущей даты и времени в момент запуска модуля в выбранном формате.
Легкое добавление заголовка с датой и временем для отчёта.
Directory
Ввод списка имён файлов и атрибутов из указанной директории.
Список всех файлов в директории — используется совместно с Dynamic Input для загрузки актуального файла данных.
Dynamic Input In-DB
Принимает имена подключений In-DB и поля запроса из стандартного потока и вводит их в поток In-DB.
Используется при создании In-DB макроса для предиктивного анализа.
Dynamic Output In-DB
Выводит информацию о In-DB workflow в стандартный workflow для Predictive In-DB.
Вывод информации о In-DB workflow в стандартный workflow для Predictive In-DB.
Map Input
Ручное рисование или выбор пространственных объектов (точки, линии, полигоны) для хранения в модуле.
Выбор пространственного объекта для использования в модуле (приложении).
Text Input
Ручной ввод данных, которые будут храниться в модуле.
Таблица подстановки со значениями для поиска и замены на новые классификации.
XDF Input
Доступ к файлам формата XDF (Revolution R Enterprise's RevoScaleR) для использования в качестве ввода для предиктивных инструментов.
Предиктивная аналитика на больших данных: линейная регрессия, деревья решений, случайный лес.
XDF Output
Запись потока данных Alteryx в файл формата XDF для масштабируемой предиктивной аналитики.
Предиктивная аналитика на больших данных с RevoScaleR.
Auto Field
Автоматическая установка типа поля для каждого строкового поля до минимально возможного размера.
Минимизация данных для ускорения обработки и обеспечения правильных форматов.
Data Cleansing
Автоматическая очистка данных с простой настройкой галочками.
Удаление NULL-значений, лишних пробелов, чисел из строковых полей.
Date Filter
Макрос для фильтрации данных по критерию даты с помощью интерфейса на основе календаря.
Возврат транзакций за указанный период с начальной и конечной датой.
Generate Rows
Создание новых строк данных — полезно для создания последовательностей чисел, транзакций или дат.
Создание временных рядов: 365 уникальных записей для каждого дня года.
Impute Values
Обновление конкретных значений в числовом поле другим выбранным значением — для замены NULL().
Замена NULL-значений зарплаты средним или медианным значением для точности анализа.
Multi-Field Binning
Группировка нескольких числовых полей в плитки или корзины — особенно для предиктивного анализа.
Группировка транзакционных данных в покупательские персоны: мужчины 30–35 лет с расходами >$1К/мес.
Multi-Field Formula
Создание или обновление нескольких полей с помощью одного выражения.
Замена NULL-значений нулями сразу в нескольких полях.
Multi-Row Formula
Создание или обновление поля с помощью выражения, ссылающегося на данные из соседних строк. Полезно для накопительных итогов.
Создание уникальных идентификаторов на уровне группы, сравнение продаж по годам в разных строках.
Random % Sample
Генерация случайного числа или процента записей, проходящих через поток данных.
Анализ на основе случайных 35% данных.
Record ID
Присвоение уникального идентификатора каждой записи.
Присвоение ID клиента для более точного прямого маркетинга в будущем.
Select Records
Выбор конкретных записей и/или диапазонов, включая несмежные диапазоны. Полезно для устранения неполадок и выборки.
Поиск записей со значением менее $100 или в диапазоне $100–$150.
Tile
Группировка данных в наборы (плитки) на основе диапазонов значений поля.
Создание логических групп: высокоценные клиенты vs. низкоценные клиенты.
Unique
Разделение данных на два потока: дублирующиеся и уникальные записи на основе выбранных полей.
Отправка письма только одному человеку на основе уникального идентификатора клиента.
Append Field
Добавление полей из исходного ввода к каждой записи целевого ввода.
Добавление временных меток и имени пользователя ко всем записям базы данных.
Find Replace
Поиск данных в одном поле из одного потока и замена значением из другого потока. Аналог Excel VLOOKUP.
Поиск и замена значений — аналог Excel Find & Replace.
Join Multiple
Объединение двух и более входов по общим полям. В выходных данных каждая строка содержит данные из всех входов.
Объединение профиля клиента, транзакционных данных и справочников по уникальному ID.
Make Group
Принимает связи между данными и собирает данные в группы на основе этих связей.
Используется преимущественно с Fuzzy Matching — ID 1 может совпадать с 10 значениями из источника 2, формируя группу.
Fuzzy Match
Выявление неидентичных дубликатов в потоке данных.
Сопоставление двух наборов данных с разными ID на основе имён и адресов.
Union
Объединение двух и более потоков данных со схожей структурой по именам или позициям полей.
Объединение данных о продажах за разные периоды в единый файл для анализа.
Date Time
Преобразование данных дата/время в различные форматы, включая форматы для выражений и для чтения человеком.
Конвертация военного времени в стандартное. Преобразование «Jan 1, 2012» в «1.1.12».
RegEx
Парсинг, сопоставление или замена данных с использованием синтаксиса регулярных выражений.
Парсинг неструктурированных текстовых файлов — веблогов или данных из Twitter.
Text to Columns
Разбивка текста из одного поля на отдельные строки или столбцы.
Разделение поля «Имя и фамилия» на два отдельных поля для удобства сортировки.
XML Parse
Чтение XML-фрагментов и их парсинг в отдельные поля.
Очистка XML-файла, парсинг XML-текста в структурированные данные.
Arrange
Ручная транспозиция и перестановка полей в презентационных целях.
Подготовка данных для отчётов с нужной компоновкой.
Count Records
Подсчёт записей, проходящих через поток данных. Возвращает 0, если записей нет.
Возвращает количество записей, проходящих через инструмент.
Cross Tab
Поворот ориентации потока данных: вертикальные поля переводятся на горизонтальную ось с агрегацией.
Преобразование столбца ID клиентов и столбца выручки: два столбца → две строки.
Running Total
Вычисление накопительной суммы для каждой записи в потоке данных.
Суммирование продаж за 3 года: год1 $10К, год2 $15К, год3 $25К → накопительные итоги.
Summarize
Агрегация: группировка, суммирование, подсчёт, пространственная обработка, конкатенация строк.
Группировка клиентов по возрасту или уровню дохода, подсчёт клиентов в штате NY.
Transpose
Поворот ориентации потока данных: горизонтальные поля переводятся на вертикальную ось.
Преобразование строки ID клиентов и строки выручки: две строки → два столбца.
Weighted Average
Вычисление взвешенного среднего набора значений, где одни записи вносят больший вклад, чем другие.
Расчёт средних расходов с учётом веса отдельных клиентов в формировании среднего.
Charting
Создание диаграмм (площадь, столбцы, линии, круговые и т.д.) для вывода через инструмент Render.
Создание столбчатых, линейных, круговых диаграмм.
Email
Отправка писем для каждой записи с вложениями или автоматически сгенерированными отчётами.
Создание динамически обновляемого содержимого писем.
Image
Добавление изображения для вывода через инструмент Render.
Добавление графики/изображения в отчёт.
Layout
Расположение двух и более отчётных сниппетов горизонтально или вертикально для вывода через Render.
Организация компонентов отчёта в нужном порядке.
Report Map
Создание карты для вывода через инструмент Render.
Создание карты для включения в отчёт.
Map Legend Builder
Повторная сборка компонентов легенды карты в единую таблицу легенды после настройки.
Принимает настроенную легенду и повторно её собирает.
Map Legend Splitter
Разбивка легенды из Report Map на составные части для настройки другими инструментами.
Настройка легенды: добавление символов $ или %, удаление избыточного текста.
Overlay
Расположение отчётных сниппетов поверх друг друга для вывода через Render.
Наложение таблицы и диаграммы на карту.
Render
Вывод отчётных сниппетов в готовые отчёты: PDF, HTML, XLSX, DOCX, PPTX, RTF.
Сохранение отчётов из Alteryx в различных форматах.
Report Footer
Добавление нижнего колонтитула к отчёту для вывода через Render.
Применение нижнего колонтитула к отчёту.
Report Header
Добавление верхнего колонтитула к отчёту для вывода через Render.
Применение верхнего колонтитула к отчёту.
Table
Создание таблицы данных для вывода через инструмент Render.
Создание таблицы для выбранных полей данных.
Report Text
Добавление и настройка текста для вывода через инструмент Render.
Настройка заголовка или других текстовых элементов отчёта.
Comment
Добавление аннотаций или изображений на холст модуля для заметок или описания процессов.
Документирование части анализа для понимания другими пользователями.
Explorer Box
Добавление веб-страницы или окна Windows Explorer на холст.
Отображение веб-страницы для справки в модуле или общей директории макросов.
Tool Container
Организация инструментов в единый блок, который можно свернуть или отключить.
Организация и группировка частей workflow по логическим этапам.
Buffer
Расширение или сужение границ пространственного объекта (обычно полигона).
Определение всех предприятий на дороге с помощью буфера вокруг неё.
Create Points
Создание пространственных точек в потоке данных на основе числовых полей координат.
Нахождение пространственного объекта по долготе и широте.
Distance
Вычисление расстояния или времени поездки между точкой и другой точкой, линией или полигоном.
Расстояние или время поездки до местоположения клиента.
Find Nearest
Определение ближайших точек или полигонов в одном файле к точкам в другом файле.
Найти ближайший к клиенту магазин с оптимизацией маршрута.
Generalize
Упрощение полигона или ломаной линии путём уменьшения количества узлов.
Генерация выходной карты береговой линии без лишней детализации.
Heat Map
Генерация полигонов, представляющих уровни «теплоты» (например, спроса) в заданной области.
Визуализация плотности домохозяйств в определённом месте.
Make Grid
Создание сетки внутри пространственных объектов в потоке данных.
Разбиение территории на ячейки для анализа источников клиентов.
Non Overlap Drivetime
Создание торговых зон в виде полигонов времени поездки, которые не перекрываются.
Создание непересекающихся торговых зон для точек продаж.
Poly-Build
Создание полигона или ломаной линии из набора точек.
Построение торговой зоны — полигона вокруг всех клиентов.
Poly-Split
Разбивка полигона или ломаной линии на составляющие полигоны, линии или точки.
Разбивка полигона на последовательный набор точек.
Spatial Info
Извлечение информации о пространственном объекте: площадь, центроид, ограничивающий прямоугольник.
Получение широты/долготы точки или площади зоны покрытия.
Spatial Match
Объединение двух потоков данных на основе взаимосвязи двух наборов пространственных объектов.
Нахождение всех клиентов в пределах торговой зоны по географической близости.
Trade Area
Определение радиусов (включая непересекающиеся) или полигонов времени поездки вокруг заданных точек.
Определение границ притока клиентов и потенциальных покупателей.
Linear Regression
Связывает целевую переменную с одной или несколькими переменными-предикторами (метод наименьших квадратов).
Количество посещений магазина в зависимости от уровня дохода клиента.
Logistic Regression
Связывает бинарную (да/нет) целевую переменную с предикторами.
Вероятность пожертвования от выпускника университета в зависимости от специальности и года выпуска.
Decision Tree
Предсказание целевой переменной с помощью набора правил if-then. Классификационное или регрессионное дерево.
Оценка заявок на кредит: выявление клиентов с очень низким риском дефолта.
Forest Model
Предсказание целевой переменной путём построения и объединения набора деревьев решений (ансамбль).
Голосование ансамбля моделей — наиболее популярный предсказанный результат побеждает.
Boosted Model
Градиентный бустинг (метод Фридмана) — последовательное добавление простых деревьев решений к ансамблю.
Определение важнейших переменных, связанных с оттоком клиентов.
Score
Вычисление предсказанного значения целевой переменной — добавляет поле Score к каждой записи.
Применение обученной модели к новым данным для скоринга клиентов.
Lift Chart
Сравнение различных моделей с «случайным угадыванием» — диаграммы прироста и инкрементального отклика.
Топ-10% клиентов по модели = 40% всех положительных откликов на маркетинговую кампанию.
K-Centroids Analysis
Разбивка записей на K групп вокруг центроидов: K-Means, K-Medians или Neural Gas.
Создание сегментов клиентов на основе поведения покупок для специализированных маркетинговых программ.
Neural Network
Многослойный перцептрон с одним скрытым слоем. Поддерживает бинарную/мультиклассовую классификацию и регрессию.
Оценка финансового риска или обнаружение мошеннических транзакций в страховой БД.
TS ARIMA
Оценка модели прогнозирования временных рядов методом ARIMA (авторегрессионное интегрированное скользящее среднее).
Автоматическое нахождение лучшей ARIMA-модели для прогнозирования ежемесячных продаж продукта.
TS ETS
Оценка модели прогнозирования временных рядов методом экспоненциального сглаживания.
Понимание влияния экономических условий, демографии и маркетинговых активностей на бизнес.
TS Forecast
Предоставление прогнозов из ARIMA или ETS модели на указанное число будущих периодов.
Управление запасами: прогноз уровня запасов на следующие 3 месяца.
Market Basket Rules
Создание правил ассоциаций или частых наборов элементов из транзакционных данных.
Кто покупает пиво, скорее всего купит и пиццу. Кто берёт рыбу — тот берёт белое вино.