最近,Khiops 迈向了战略里程碑, 开源许可证使其具有更广泛的可及性和更广泛的受众。
在探索这一重大转变之前,值得重新审视该工具的优势
为了使机器学习模型正常运行
需要一个数据准备过程——这个过程通常冗长、费力且昂贵。这就是 Khiops 的作用所在,“通过自动化和加速以前手动完成的操作,例如 特征工程— 换句话说,就是将原始数据转换成可用变量的过程,” Orange 的 AI 研究员 Alexis Bondu 解释道。“数据专家 目标电话号码或电话营销数据 可能要花很长时间准备、清理、汇总大量数据,而 Khiops 省去了这些步骤,让他们能够将精力集中在手头的业务问题上。”
Khiops 采用了开源世界公认的标准,例如 Python 虚拟环境、Sklearn 语法和通过 conda 安装程序。
独特的方法
深入研究细节,Khiops 基于原始的数学形式主义和一种不受 超参数。此功能具有非常明显的优势:即防止过度拟合现象(死记硬背数据),这种现象对模型的性能不利。它还避免了非常耗时的反复试错,从而节省了处理时间。
该工具的另一个与众不同之处在于它如何增强可解释性:产生的每个决策和结果都可 IT 部门如何为未来做好准备 透明地解释,从而使 Khiops 能够预防任何黑箱效应。
利用开源扩大影响力
到目前为止,Orange 集团内的一个社区几乎独家拥有 Khiops 的首批版本。大约 1000 名用户被该解决 WhatsApp 号码 方案的性能所折服,该解决方案在可访问性、标准化和文档化工作完成之前进行了测试。当时,掌握该解决方案需要一定的专业知识和事先的培训时间。该工具于 2022 年底启动向开源生态系统的迁移,消除了其更广泛使用的障碍。Khiops 通过采用开源世界公认的标准(例如 Python 虚拟环境、Sklearn 语法和通过 conda 安装程序)实现了标准化。与此同时,重点放在简化文化适应和技能开发过程上,在网站khiops.org上免费提供可访问的技术文档、指南、解释性笔记本等。