歡迎光臨
每天分享高質量文章

ML.NET 0.10特性簡介

IDataView被單獨作為一個類庫包

IDataView組件為表格式資料提供了非常高效的處理方式,尤其是用於機器學習和高級分析應用。它被設計為可以高效地處理高維資料和大型資料集。並且也適合處理屬於更大的分佈式資料集中的單個資料區塊結點。

在ML.NET 0.10中,IDataView被拆分成單個程式集和NuGet類庫包。這對於與其它API及框架交互是極重要的一步。

在被拆分後,其它的類庫將能直接取用它,而不需要取用整個ML.NET。這樣有助於第三方類庫也能使用IDataView所提供的強大功能。

場感知分解機訓練器支持多個特征列

在之前的ML.NET版本中,當使用場感知分解機(FFM)訓練器時,僅可以提供單個特征列。

在新的版本里,支持在Options引數里添加額外的特征列。

var ffmArgs = new FieldAwareFactorizationMachineTrainer.Options();// Create the multiple field names.ffmArgs.FeatureColumn = nameof(MyObservationClass.MyField1); // 首個欄位ffmArgs.ExtraFeatureColumns = new[]{ nameof(MyObservationClass.MyField2), nameof(MyObservationClass.MyField3) }; // 額外的欄位var pipeline = mlContext.BinaryClassification.Trainers.FieldAwareFactorizationMachine(ffmArgs);var model = pipeline.Fit(dataView);

支持傳回多個預測標簽

之前的版本里,即使預測多類別分類問題,也只能傳回單一的標簽。

現在,這一缺陷終於被修複了。(其實在內部邏輯里已經對多項預測完成處理,但過去的API只傳回了單一的結果)

源自社區的示例頁面

作為ML.NET Samples的一部分,現在新增了一個特殊頁面——由社區提供的多個示例。

裡面有不少很好的例子:

照片查詢的WPF應用,其內部運行TensorFlow模型,並匯出為ONNX格式。

使用ML.NET的UWP應用:

當然,歡迎有越來越多的貢獻者加入其中,提供更多的示例。

原文地址:https://www.cnblogs.com/kenwoo/p/10367137.html

赞(0)

分享創造快樂