• Технологии. Инновации. Бизнес.
    Знание существует для того, чтобы его распространять
   Вернуться назад

Словарь терминов больших данных (русский-английский-китайский)

2018-04-09  |   Словарь терминов больших данных (русский-английский-китайский)

Современные информационные технологии напрямую связаны с большими данными, «биг дата». Говоря о больших данных, волей-неволей приходится использовать огромное количество терминов. Большинство из них приходят в русский из других языков, особенно много слов заимствуется из английского. При этом в некоторых языках (например, в китайском) вообще используется собственная терминология. Сориентироваться в этом многообразии поможет краткий словарь терминов от Китайской Ассоциации Переводчиков, переведённый Sialia Global.

Большие данные

Английский: big data, mega data

Китайский: 大数据

Большие данные или «биг дата» (жарг.) – большой объем информационных активов, для обработки которых требуются новейшие алгоритмы.

4V больших данных: Volume(大量)– объем, Velocity(高速)– скорость, Variety(多样)– многообразие, Value(价值)– ценность для экономики, науки и общества.

Hadoop – на всех языках одинаково. Это платформа с открытым исходным кодом для обработки больших данных на базе распределенной файловой системы(Hadoop Distributed File System или HDFS, 分布式文件系统).

HDFS отличается высокой устойчивостью к отказам, при этом возможно использование недорогостоящего (low-cost, 低廉) «железа»; обеспечивает высокую пропускную способность (high throughput, 高吞吐量). Центральные компоненты Hadoop: HDFS и MapReduce (Map 映射 – «отображение»; Reduce 归约 – «редукция», «приведение к форме»).

Интеллектуальный анализ коммерческой информации, бизнес-аналитика

Английский: Business Intelligence или BI

Китайский: 商业智能

CRM

Китайский: CRM или 客户关系管理

Облачные вычисления

Английский: Cloud Computing

Китайский: 云计算

Метод хранения, передачи информации, используемый специальными онлайн-сервисами; источник виртуализации (Virtualisation Source, 虚拟化的资源).

Облачные вычисления связаны с такими терминами, как распределенные вычисления (Distributed Computing, 分布式计算), параллельные вычисления(Parallel Computing, 行计算) и коммунальные вычисления (Utility Computing, 效用计算), сетевые технологии хранения данных (Network Storage Technologies, 网络存储), виртуализация (Virtualisation, 虚拟化), балансировка или выравнивание нагрузки (Load Balance, 负载均衡).

Хранилище данных

Английский: Data Warehouse или DW, или DWH

Китайский: 数据仓库

Структурированный метод

Английский: Structured Method

Китайский: 结构化分析方法

Полуструктурированные данные

Английский: semi-structured data

Китайский: 半结构化数据)

База данных

Английский: Database

Китайский: 数据库

Анализ данных

Английский: Data Analysis

Китайский: 数据分析

Анализ данных с поиском соответствия

Английский: Data mining

Китайский: 数据挖掘

Или

Добыча данных

Английский: Knowledge-Discovery in Databases

Китайский: 数据库知识发现

Визуализация

Английский: Visualisation

Китайский: 可视化

Управление данными о продукте

Английский: Product Data Management

Китайский: 产品数据管理

Связано с такими терминами как распределенная сеть (distributed network, 分布式网络), иерархичная архитектура (host-guest architecture, 主从结构), графический интерфейс (graphical user interface, 图形化用户接口), фреймворк(framework, 软件框架).

Потоковый отбор (ривер, потоковая выборка)

Английский: River Sampling

Китайский: 流式采样

Панельный отбор (панельная выборка)

Английский: Panel Sampling

Китайский: 面板采样

Обогащение данных

Английский: Data Enrichment

Китайский: 数据浓缩, 数据充实