knime中文教程,knime中文版
knime在linux下怎么安装
KNIME 是一个开源工作流引擎和工具,非常适合此类型的数据分析。它安装了 1000 多个预定义的节点,受许多外部分析工具包的支持,包括商用和开源的工具包。KNIME 可通过下载获得,可将它用在 Microsoft? Windows?、Mac? 和 Linux? 上。您可以获取教程来帮助学习 KNIME,它的理念非常简单。您以从节点存储库中拖出各个节点并放在画布上。要指明数据流,可以绘制一条从一个节点的输入端口指向该流中下移节点的导入 节点的箭头。
示例 Apache 访问日志分析
例如,您可以使用 KNIME 分析,在一个接受传入 HTTP 请求的 Apache HTTP Server? 的传统三层架构的操作中,分析资源使用情况。这些请求会被路由到应用服务器节点,比如 IBM? WebSphere? Application Server,或者路由到其他可用于处理动态请求的中间层服务器。
要理解负载对资源使用情况的影响,需要基于不断发出的 HTTP 请求,将外部负载与应用服务器或数据库层使用的服务器资源相关联。为此,您需要:
分析 Apache 访问日志文件。
规范化来自日志文件的时间戳,以便重点关注某个特定时间段。
确定一个时间区间。
提取在这些时间内请求的特定的 URL。
下载 示例 KNIME 工作流,学习如何在 KNIME 内完成此分析,以及如何使用类似工作流从其他类型的日志文件(比如 CPU 日志、数据库资源日志或垃圾收集日志)中提取资源信息,使用这些信息来执行这种类型的关联。
要导入示例工作流,可以将它下载到您的文件系统中,选择 FileImport KNIME workflow... 并按照导入向导来将它导入到 KNIME 中。
查看导入的工作流(如图 1 所示),您可以看到,该工作流首先是一个 Weblog Reader,可以通过配置它来读取 Apache 访问日志的格式。
数据可视化分析工具有没有完全免费的?
1. Excel / Spreadsheet
excel 基本上支持了最常用的数据分析功能:用来概述(总结)数据特征,数据可视化,对数据转型(去除噪音数据)从而得到新的数据集用来分析等。尽管Microsoft excel这个软件是付费的,但你可以用其替代品,例如open office, google docs!
2. Trifacta
excel在数据大小上有限制,但这个工具没有这样的局限,您可以安全地用它处理大数据集。这个工具有令人难以置信的特性,如图表推荐、内置算法、分析洞察力,您可以使用这些特性在任何时间内生成报告。
3. Rapid Miner
在建立机器学习模型方面的具有专业性,包含了我们经常使用的所有ML算法。能闪电般的快速水平上提供分析经验。他们的生产线上有几个为大数据、可视化、模型部署而构建的产品,其中一些产品(企业)包括订阅费。
4. Rattle GUI
提供了足够的选项来探索、转换和建模数据。它在统计分析方面的选择比SPSS少。但是,SPSS是一个付费工具。
5. Qlikview
获得商业洞察力并以一种极具吸引力的方式将其呈现出来。有了它较先进的可视化功能,你会惊讶于你在处理数据时所得到的控制量。它有一个内置的推荐引擎,可以不时地更新有关较佳可视化的信息。
6. Weka
使用Weka的一个优点是它很容易学习。作为一个机器学习工具,它的界面是足够直观的,你可以迅速完成工作。它为数据预处理、分类、回归、聚类、关联规则和可视化提供了选择。建立在Java之上。
7. KNIME
提供了一个开放源码的分析数据的平台,以后可以使用其他支持KNIME的产品进行部署。该工具在数据融合、可视化和先进的机器学习算法等方面具有丰富的特点。
8. Orange
目的是产生交互式数据可视化和数据挖掘任务。YouTube上有足够的教程来学习这个工具。它有一个广泛的数据挖掘任务库,包括所有的分类、回归、聚类方法。
9. Tableau Public
Tableau是一个数据可视化软件。快速探索数据的可视化软件,每一次观察都可使用各种可能的图表。它是一种由自己计算出数据类型、可用的较佳方法等的智能算法。
10. Data Wrapper
这是一个闪电般的快速可视化软件。可视化桶由线条图、条形图、列图、饼图、叠加条形图和地图组成。此工具启用浏览器,不需要任何软件安装。
11. Data Science Studio (DSS)
它是一个旨在连接技术,业务和数据的强大工具。它可分为两部分:编码和非编码。它对任何旨在发展,建立,在网络上部署和扩展模型的组织来说都是一个完整的软件包。
12. OpenRefine
专门研究混乱的数据;为预测建模目的而清理、转换和塑造数据。使用Open Refine进行改进,分析人员不仅可以节省时间,还可以将其用于生产工作。