Словарь терминов больших данных (русский-английский-китайский)
2018-04-09 | Дарья Логунова
Современные информационные технологии напрямую связаны с большими данными, «биг дата». Говоря о больших данных, волей-неволей приходится использовать огромное количество терминов. Большинство из них приходят в русский из других языков, особенно много слов заимствуется из английского. При этом в некоторых языках (например, в китайском) вообще используется собственная терминология. Сориентироваться в этом многообразии поможет краткий словарь терминов от Китайской Ассоциации Переводчиков, переведённый Sialia Global.
Большие данные
Английский: big data, mega data
Китайский: 大数据
Большие данные или «биг дата» (жарг.) – большой объем информационных активов, для обработки которых требуются новейшие алгоритмы.
4V больших данных: Volume(大量)– объем, Velocity(高速)– скорость, Variety(多样)– многообразие, Value(价值)– ценность для экономики, науки и общества.
Hadoop – на всех языках одинаково. Это платформа с открытым исходным кодом для обработки больших данных на базе распределенной файловой системы(Hadoop Distributed File System или HDFS, 分布式文件系统).
HDFS отличается высокой устойчивостью к отказам, при этом возможно использование недорогостоящего (low-cost, 低廉) «железа»; обеспечивает высокую пропускную способность (high throughput, 高吞吐量). Центральные компоненты Hadoop: HDFS и MapReduce (Map 映射 – «отображение»; Reduce 归约 – «редукция», «приведение к форме»).
Интеллектуальный анализ коммерческой информации, бизнес-аналитика
Английский: Business Intelligence или BI
Китайский: 商业智能
CRM
Китайский: CRM или 客户关系管理
Облачные вычисления
Английский: Cloud Computing
Китайский: 云计算
Метод хранения, передачи информации, используемый специальными онлайн-сервисами; источник виртуализации (Virtualisation Source, 虚拟化的资源).
Облачные вычисления связаны с такими терминами, как распределенные вычисления (Distributed Computing, 分布式计算), параллельные вычисления(Parallel Computing, 行计算) и коммунальные вычисления (Utility Computing, 效用计算), сетевые технологии хранения данных (Network Storage Technologies, 网络存储), виртуализация (Virtualisation, 虚拟化), балансировка или выравнивание нагрузки (Load Balance, 负载均衡).
Хранилище данных
Английский: Data Warehouse или DW, или DWH
Китайский: 数据仓库
Структурированный метод
Английский: Structured Method
Китайский: 结构化分析方法
Полуструктурированные данные
Английский: semi-structured data
Китайский: 半结构化数据)
База данных
Английский: Database
Китайский: 数据库
Анализ данных
Английский: Data Analysis
Китайский: 数据分析
Анализ данных с поиском соответствия
Английский: Data mining
Китайский: 数据挖掘
Или
Добыча данных
Английский: Knowledge-Discovery in Databases
Китайский: 数据库知识发现
Визуализация
Английский: Visualisation
Китайский: 可视化
Управление данными о продукте
Английский: Product Data Management
Китайский: 产品数据管理
Связано с такими терминами как распределенная сеть (distributed network, 分布式网络), иерархичная архитектура (host-guest architecture, 主从结构), графический интерфейс (graphical user interface, 图形化用户接口), фреймворк(framework, 软件框架).
Потоковый отбор (ривер, потоковая выборка)
Английский: River Sampling
Китайский: 流式采样
Панельный отбор (панельная выборка)
Английский: Panel Sampling
Китайский: 面板采样
Обогащение данных
Английский: Data Enrichment
Китайский: 数据浓缩, 数据充实