# 数据输入输出
#输入文本数据 (input_data_manually.v1)
手动输入文本数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 文本数据 | text | code | 文本数据 | 默认代码 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#输入特征列表 (input_features.v1)
输入特征(因子)数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征输入 | features_ds | 通用 | 特征输入,通过输入端和参数方式输入的特征将做合并 | None |
输入参数 | 特征数据 | features | code | 特征数据 | 默认代码 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#代码列表 (instruments.v2)
获取指定市场和指定时间区间有效的代码列表
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 滚动训练参数 | rolling_conf | 通用 | 滚动训练参数,如果指定,将覆盖参数开始日期和结束日期 | None |
输入参数 | 开始日期 | start_date | str | 开始日期,示例 2017-01-01 | |
结束日期 | end_date | str | 结束日期,示例 2017-01-01 | ||
交易市场 | market | choice | 交易市场,见文档交易市场 | CN_STOCK_A | |
代码列表 | instrument_list | code | 代码列表,每行一个,如果指定,market参数将被忽略 | 默认代码 | |
最大数量 | max_count | int | 最大数量,0表示没有限制,一般用于在小数据上测试和调试问题 | 0 | |
输出端 | 数据 | data | 通用 | 数据 |
#成交单csv数据读取 (order_record_input.v5)
成交单csv数据读取,读取后可以对成交单进行基本的收益风险分析和绩效评估.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 交易记录文件名 | trading_records_filename | str | 交易记录文件名 | 模板策略/股票/常用工具/.交割单模板.csv |
成交日期列名 | date_col | str | 成交日期列名 | 成交日期 | |
证券代码列名 | instrument_col | str | 证券代码列名 | 证券代码 | |
买卖标志列名 | side_col | str | 买卖标志列名 | 买卖标志 | |
成交价格列名 | trade_price_col | str | 成交价格列名 | 成交价格 | |
成交数量列名 | trade_volume_col | str | 成交数量列名 | 成交数量 | |
输出端 | 股票代码 | instruments_ds | 通用 | 股票代码 | |
交易记录 | trading_records_ds | 通用 | 交易记录 |
#数据源 (use_datasource.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表 | None |
特征列表 | features | 通用 | 特征列表 | None | |
输入参数 | ID或别名 | datasource_id | str | ID或别名,示例 bar1d | *必填 |
开始日期 | start_date | str | 开始日期 | ||
结束日期 | end_date | str | 结束日期 | ||
输出端 | 数据源 | data | 通用 | 数据源 |
# 数据处理
#添加指数数据 (add_index_data_to_trade_data.v1)
添加指数数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
输入参数 | 指数证券代码 | instruments | str | 指数证券代码,多个代码用英文逗号分隔 | 000905.HIX |
输出端 | 数据 | data | 通用 | 数据 | |
用于回测交易的证券代码列表 | instruments | 通用 | 用于回测交易的证券代码列表 |
#A股股票过滤 (chinaa_stock_filter.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 股票数据 | input_data | 通用 | 股票数据 | *必填 |
输入参数 | 股票类别 | index_constituent_cond | choice | 股票类别 | ['全部'] |
上市板 | board_cond | choice | 上市板 | ['全部'] | |
行业 | industry_cond | choice | 行业 | ['全部'] | |
过滤ST | st_cond | choice | 过滤ST,ST股票 | ['全部'] | |
过滤退市股票 | delist_cond | choice | 过滤退市股票 | ['全部'] | |
输出剩余数据 | output_left_data | bool | 输出剩余数据 | False | |
输出端 | 输出数据 | data | 通用 | 输出数据 | |
剩余数据 | left_data | 通用 | 剩余数据 |
#数据合并 (concat.v3)
将输入的数据按行进行上下合并,比如df1、df2各自10行,合并后就是20行的一个数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input_data_1 | 通用 | 输入1,DataSource第1个 | None |
输入2 | input_data_2 | 通用 | 输入2,DataSource第2个 | None | |
输入3 | input_data_3 | 通用 | 输入3,DataSource第3个 | None | |
输入参数 | 输入列表 | input_data_list | doc | 输入列表,DataSource列表 | [] |
输出端 | 合并后的数据 | data | 通用 | 合并后的数据 |
#转换CSV为HDF (convert_csv_to_hdf.v1)
将CSV格式的数据源,转换为HDF格式。HDF是本平台推荐和默认使用的数据格式,其读写性能比CSV高一个数量级。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入CSV数据源 | input_ds | 通用 | 输入CSV数据源 | *必填 |
输出端 | 输出HDF数据源 | data | 通用 | 输出HDF数据源 |
#缺失数据处理 (dropnan.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据源 | input_data | 通用 | 输入数据源 | *必填 |
训练-特征 | features | 通用 | 训练-特征,去掉指定特征列空值。默认为空,去掉有空值的行 | None | |
输出端 | 数据 | data | 通用 | 数据 |
#特征描述性分析 (feature_describe_analysis.v1)
标准化处理,也可称为归一化处理,属于数据处理常见的一种方式.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 因子列表 | columns_input | code | 因子列表 | 默认代码 |
输出端 | 描述分析结果 | data | 通用 | 描述分析结果 |
#缺失数据填充 (fillnan.v1)
数据缺失处理,对所有列的NaN按平均值(mean),中位数(median)填充,也可指定值。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据源 | input_data | 通用 | 输入数据源 | *必填 |
训练-特征 | features | 通用 | 训练-特征 | None | |
输入参数 | 填充值 | fill_value | str | 填充值,支持数值/mean/median,默认填充0.0 | 0.0 |
输出端 | 数据 | data | 通用 | 数据 |
#数据过滤 (filter.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
输入参数 | 过滤表达式 | expr | str | 过滤表达式, 参考示例代码和DataFrame.query,包含特使字符的列名需要使用反单引号(`)引起来,例如 `close_10/close0` > 0.91 | *必填 |
输出剩余数据 | output_left_data | bool | 输出剩余数据 | False | |
输出端 | 输出数据 | data | 通用 | 输出数据 | |
剩余数据 | left_data | 通用 | 剩余数据 |
#连接数据 (join.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 第一个输入数据 | data1 | 通用 | 第一个输入数据 | *必填 |
第二个输入数据 | data2 | 通用 | 第二个输入数据 | *必填 | |
输入参数 | 关联列 | on | str | 关联列,多个列用英文逗号分隔 | date,instrument |
连接方式 | how | choice | 连接方式 | inner | |
对结果排序 | sort | bool | 对结果排序 | False | |
输出端 | 连接后的数据 | data | 通用 | 连接后的数据 |
#连接数据-4输入 (joinx.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | data1 | 通用 | 输入1 | *必填 |
输入2 | data2 | 通用 | 输入2 | *必填 | |
输入3 | data3 | 通用 | 输入3 | *必填 | |
输入4 | data4 | 通用 | 输入4 | *必填 | |
输入参数 | 关联列 | on | str | 关联列,多个列用英文逗号分隔 | date,instrument |
连接方式 | how | choice | 连接方式 | inner | |
对结果排序 | sort | bool | 对结果排序 | False | |
输出端 | 连接后的数据 | data | 通用 | 连接后的数据 |
#排序 (sort.v4)
排序.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_ds | 通用 | 输入数据 | *必填 |
排序特征 | sort_by_ds | 通用 | 排序特征 | None | |
输入参数 | 根据哪一列排序 | sort_by | str | 根据哪一列排序 | -- |
根据哪些列group | group_by | str | 根据哪些列group,用逗号分隔 | date | |
保留哪些列 | keep_columns | str | 保留哪些列 | -- | |
升序 | ascending | bool | 升序 | True | |
输出端 | 排序后数据 | sorted_data | 通用 | 排序后数据 |
#标准化处理 (standardlize.v8)
标准化处理,也可称为归一化处理,属于数据处理常见的一种方式.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
因子列表 | input_2 | 通用 | 因子列表 | None | |
输入参数 | 指定列 | columns_input | code | 指定列 | 默认代码 |
输出端 | 标准化数据 | data | 通用 | 标准化数据 |
#股票池初选 (stockpool_select.v6)
根据行业、指数、ST、停牌等过滤条件获取初步股票池。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 自定义股票列表 | self_instruments | code | 自定义股票列表 | 默认代码 |
指定概念板块 | input_concepts | code | 指定概念板块 | 默认代码 | |
指定行业 | input_industrys | code | 指定行业 | 默认代码 | |
指数范围 | input_indexs | code | 指数范围 | 默认代码 | |
过滤ST股 | input_st | choice | 过滤ST股 | 过滤 | |
过滤停牌股 | input_suspend | choice | 过滤停牌股 | 过滤 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#去极值 (winsorize.v6)
去极值,属于常见的数据处理模块,将剔除偏离中位数5倍以上的数据.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
因子列表 | features | 通用 | 因子列表 | None | |
输入参数 | 指定列 | columns_input | code | 指定列 | 默认代码 |
指定标准差倍数 | median_deviate | int | 指定标准差倍数 | 3 | |
输出端 | 去极值数据 | data | 通用 | 去极值数据 |
# 数据标注
#自动标注(股票) (advanced_auto_labeler.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表 | *必填 |
输入参数 | 标注表达式 | label_expr | code | 标注表达式,可以使用多个表达式,顺序执行,从第二个开始,可以使用label字段。可用数据字段,添加benchmark_前缀,可使用对应的benchmark数据。可用操作符和函数见表达式引擎 | 默认代码 |
开始日期 | start_date | str | 开始日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的开始日期 | ||
结束日期 | end_date | str | 结束日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的结束日期 | ||
基准指数 | benchmark | str | 基准指数,如果给定,可以使用 benchmark_* 变量 | 000300.SHA | |
删除无标注数据 | drop_na_label | bool | 删除无标注数据,是否删除没有标注的数据 | True | |
将标注转换为整数 | cast_label_int | bool | 将标注转换为整数,一般用于分类学习 | True | |
自定义表达式函数 | user_functions | code | 自定义表达式函数,字典格式,例:{'user_rank':user_rank},字典的key是方法名称,字符串类型,字典的value是方法的引用,参考文档表达式引擎 | 默认代码 | |
输出端 | 标注数据 | data | 通用 | 标注数据 |
#自动标注(任意数据源) (auto_labeler_on_datasource.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 用来做标注的数据 | input_data | 通用 | 用来做标注的数据,一般是行情数据 | *必填 |
输入参数 | 标注表达式 | label_expr | code | 标注表达式,可以使用多个表达式,顺序执行,从第二个开始,可以使用label字段。可用数据字段。可用操作符和函数见表达式引擎 | 默认代码 |
删除无标注数据 | drop_na_label | bool | 删除无标注数据,是否删除没有标注的数据 | True | |
将标注转换为整数 | cast_label_int | bool | 将标注转换为整数,一般用于分类学习 | True | |
日期列名 | date_col | str | 日期列名,标明日期列,如果在表达式中用到切面相关函数时,比如 rank,会用到此列名 | date | |
证券代码列名 | instrument_col | str | 证券代码列名,标明证券代码列,如果在表达式中用到时间序列相关函数时,比如 shift,会用到此列名 | instrument | |
自定义表达式函数 | user_functions | code | 自定义表达式函数,字典格式,例:{'user_rank':user_rank},字典的key是方法名称,字符串类型,字典的value是方法的引用,参考文档表达式引擎 | 默认代码 | |
输出端 | 标注数据 | data | 通用 | 标注数据 |
# 特征抽取
#衍生特征抽取 (derived_feature_extractor.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输出数据 | input_data | 通用 | 输出数据,抽取后特征数据,包含用于构建衍生因子的基础因子数据,一般来自基础特征抽取或者衍生特征抽取模块 | *必填 |
特征列表 | features | 通用 | 特征列表,需要抽取的衍生特征,由表达式构建。可用数据字段来自输入的data,可用操作符和函数见表达式引擎 | *必填 | |
输入参数 | 日期列名 | date_col | str | 日期列名,如果在表达式中用到切面相关函数时,比如 rank,会用到此列名 | date |
代码列名 | instrument_col | str | 代码列名,如果在表达式中用到时间序列相关函数时,比如 shift,会用到此列名 | instrument | |
删除na数据 | drop_na | bool | 删除na数据,删除存在空数据(NA)的行 | False | |
删除多余的列 | remove_extra_columns | bool | 删除多余的列,删除不在输入特征、日期和代码的列 | False | |
自定义表达式函数 | user_functions | code | 自定义表达式函数,字典格式,例:{'user_rank':user_rank},字典的key是方法名称,字符串类型,字典的value是方法的引用,参考文档表达式引擎 | 默认代码 | |
输出端 | 输出数据 | data | 通用 | 输出数据,抽取后特征数据 |
#高频特征抽取-分钟到日频 (feature_extractor_1m.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
表达式引擎自定义函数 | user_functions | 通用 | 表达式引擎自定义函数,字典格式,例: {'user_rank':user_rank},字典的key是函数名称,字符串类型,字典的value是函数方法 | {} | |
输入参数 | 开始日期 | start_date | str | 开始日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的开始日期 | |
结束日期 | end_date | str | 结束日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的结束日期 | ||
向前取数据天数 | before_start_days | float | 向前取数据天数,比如,用户通过表达式计算的衍生特征,可能需要用到开始日期之前的数据,可以通过设置此值实现,则数据将从 开始日期-向前取数据天数 开始取。考虑到节假日等,建议将此值得大一些 | 90 | |
并行计算数量 | workers | int | 并行计算数量 | 2 | |
并行模式 | parallel_mode | choice | 并行模式:集群模式,使用集群多机并行;单机模式,使用单机多进程并行;测试模式,仅随机选择少量数据做特征抽取,一般用于测试表达式是否正确 | 集群 | |
分钟数据源 | table_1m | str | 分钟数据源,分钟数据源表id | level2_bar1m_{instrument_} | |
输出端 | 基础特征数据 | data | 通用 | 基础特征数据 |
#表达式引擎自定义函数 (feature_extractor_user_function.v1)
表达式引擎用户自定义函数
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 自定义函数集 | input_functions | 通用 | 自定义函数集,可用于多个自定义函数组合为一个集合 | None |
输入参数 | 函数名 | name | str | 函数名 | *必填 |
函数代码 | func | code | 函数代码 | 默认代码 | |
输出端 | 函数 | functions | 通用 | 函数 |
#基础特征抽取 (general_feature_extractor.v7)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
输入参数 | 开始日期 | start_date | str | 开始日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的开始日期 | |
结束日期 | end_date | str | 结束日期,示例 2017-02-12,一般不需要指定,使用 代码列表 里的结束日期 | ||
向前取数据天数 | before_start_days | float | 向前取数据天数,比如,用户通过表达式计算的衍生特征,可能需要用到开始日期之前的数据,可以通过设置此值实现,则数据将从 开始日期-向前取数据天数 开始取。考虑到节假日等,建议将此值得大一些 | 90 | |
输出端 | 基础特征数据 | data | 通用 | 基础特征数据 |
# 机器学习
# 分类
#自适应提升树-分类 (adaboost_classifier.v1)
adaboost自适应提升树算法,用于分类,此算法基于boosting,根据上次分类的准确率确定下次训练每个样本的权值,将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器融合,作为最后的决策分类器。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 弱学习器个数 | n_estimators | int | 弱学习器个数,弱学习器最大迭代次数,太小容易欠拟合,太大容易过拟合,默认为50 | 50 |
分类算法 | algorithm | choice | 分类算法,SAMME.R使用了对样本集分类的预测概率大小来作为弱学习器权重,迭代一般比SAMME快 | SAMME.R | |
学习率 | learning_rate | float | 学习率,该值缩减每个弱学习器的权重,通常较小的系数需要更多的迭代,因此n_estimators和learning_rate要一起调参 | 1.0 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列名用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#Bagging-分类 (bagging_classifier.v1)
Bagging有放回随机抽样算法,用于分类,有放回随机抽取小样本,训练弱学习器,采取多数投票机制获得最终分类结果。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 弱学习器个数 | n_estimators | int | 弱学习器个数,基准估计器个数,默认为10 | 10 |
随机子集比重 | subsample | float | 随机子集比重,训练基准估计器使用该随机子集 | 1.0 | |
特征使用率 | feature_fraction | float | 特征使用率,寻找最佳分割时要考虑的特征比率,float类型,默认考虑所有特征数,即取值1.0 | 1.0 | |
数据有放回抽样 | bootstrap | bool | 数据有放回抽样,是否有放回采样,默认为True | True | |
特征有放回抽样 | bootstrap_features | bool | 特征有放回抽样,是否对特征有放回采样,默认为False | False | |
采用袋外样本来评估误差 | oob_score | bool | 采用袋外样本来评估误差,是否使用袋外样本估计泛化误差,默认为False,评估结果保存在oob_score_ | False | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#决策树-分类 (decision_tree_classifier.v1)
决策树算法,用于分类,决策树从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 决定分割的标准 | criterion | choice | 决定分割的标准,支持基尼不纯度gini和熵不纯度entropy,默认是gini | gini |
特征使用率 | feature_fraction | float | 特征使用率,寻找最佳分割时要考虑的特征比率 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数,每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#极端随机森林-分类 (extra_trees_classifier.v1)
对于随机森林的优化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 决定分割的标准 | criterion | choice | 决定分割的标准,支持基尼不纯度gini和熵不纯度entropy,默认是gini | gini |
树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 | |
特征使用率 | feature_fraction | float | 特征使用率:寻找最佳分割时要考虑的特征比率 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#梯度提升树-分类 (gradient_boosting_classifier.v1)
梯度提升树-分类。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定特征输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 损失函数 | loss | choice | 损失函数,对于分类模型,有对数似然损失函数deviance和指数损失函数exponential | deviance |
学习率 | learning_rate | float | 学习率,这个参数决定着每一个决策树对于最终结果的影响。GBM设定了初始的权重值之后,每一次树分类都会更新这个值,较小的值使得模型对不同的树更加稳健 | 0.1 | |
树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 | |
训练每个决策树所用到的子样本占总样本的比例 | subsample | float | 训练每个决策树所用到的子样本占总样本的比例,稍小于1的值能够使模型更稳健,因为这样减少了方差 | 1.0 | |
树中终点节点所需要的最少的样本数 | min_samples_per_leaf | int | 树中终点节点所需要的最少的样本数,也可以用来防止过度拟合 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强 | 3 | |
特征使用率 | feature_fraction | float | 特征使用率,寻找最佳分割时要考虑的特征比率,float类型,默认考虑所有特征数,即取值1.0 | 1.0 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#k近邻-分类 (kneighbors_classifier.v1)
用于分类
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 近邻数 | n_neighbors | int | 近邻数,int类型,可选参数,默认值为5 | 5 |
K近邻权重类型 | weights | choice | K近邻权重类型,用于预测。默认值为uniform | uniform | |
计算分类使用的算法 | algorithm | choice | 计算分类使用的算法,可选参数,ball_tree为算法BallTree,kd_tree为KDTree,brute使用暴力搜索,auto基于传入内容使用合适算法。默认值为auto | auto | |
BallTree或者KDTree算法的叶子数量 | leaf_size | int | BallTree或者KDTree算法的叶子数量,int类型,可选参数,此参数会影响构建、查询BallTree或者KDTree的速度,以及存储BallTree或KDTree所需要的内存大小。默认值30 | 30 | |
距离度量 | metric | choice | 距离度量,默认为minkowski,也称欧式距离 | minkowski | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#线性随机梯度下降-分类 (linear_sgd_classifier.v1)
线性随机梯度下降算法,用于分类。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 损失函数 | loss | choice | 损失函数 | log |
正则类型 | penalty | choice | 正则类型 | l2 | |
L2 惩罚项(正则项) 参数 | alpha | float | L2 惩罚项(正则项) 参数 | 0.0001 | |
最大迭代次数 | max_iter | int | 最大迭代次数 | 5 | |
是否先随机打乱 | shuffle | bool | 是否先随机打乱 | True | |
初始学习率 | eta0 | float | 初始学习率 | 0.1 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#线性-分类 (logistic_regression.v1)
逻辑斯蒂回归。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 指定惩罚项中使用的规范 | penalty | choice | 指定惩罚项中使用的规范 | l2 |
对偶或原始方法 | dual | bool | 对偶或原始方法,bool类型,默认为False。对偶方法只用在求解线性多核(liblinear)的L2惩罚项上。当样本数量>样本特征的时候,dual通常设置为False | False | |
是否存在截距或偏差 | fit_intercept | bool | 是否存在截距或偏差,默认为True | True | |
停止求解的标准 | tol | float | 停止求解的标准 | 0.0001 | |
正则化系数λ的倒数 | C | float | 正则化系数λ的倒数 | 1.0 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#多层感知器-分类 (mlp_classifier.v1)
用于分类的机器学习算法。多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。可用于线性不可分数据。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 输入该隐藏层的神经元个数 | hidden_layer_sizes | str | 输入该隐藏层的神经元个数,用英文逗号(,)分隔的整数元组,例如 100,100,表示有两层隐藏层,第一层隐藏层有100个神经元,第二层也有100个神经元 | 100 |
隐藏层的激活函数类型 | activation | choice | 隐藏层的激活函数类型 | relu | |
优化器 | solver | choice | 优化器,用于优化权重,默认为adam | adam | |
L2 惩罚项(正则项) 参数 | alpha | float | L2 惩罚项(正则项) 参数 | 0.0001 | |
随机优化算法的批量大小 | batch_size | int | 随机优化算法的批量大小,如果优化器是 ‘lbfgs’, 将不会生效 | 200 | |
学习率的初始默认值 | learning_rate_init | float | 学习率的初始默认值,当且仅当优化策略是SGD或者ADAM时,才有意义。本参数控制着更新权重时的步长 | 0.001 | |
最大可迭代次数 | max_iter | int | 最大可迭代次数,优化器直至收敛(视最小容忍度而定)或者到达最大迭代次数时,算法停止 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#随机森林-分类 (random_forest_classifier.v1)
随机森林算法,可以用做分类和回归类的训练。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 |
特征使用率 | feature_fraction | float | 特征使用率:寻找最佳分割时要考虑的特征比率 | 1.0 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#支持向量机-分类 (svc.v1)
支持向量分类。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定特征输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | C-SVC惩罚系数 | C | float | C-SVC惩罚系数,即对误差的宽容度,C越高,说明越不能容忍出现误差,容易过拟合。C越小,容易欠拟合。C过大或过小,泛化能力变差 | 1.0 |
核函数类型 | kernel | choice | 核函数类型 | rbf | |
多项式poly函数的维度 | degree | int | 多项式poly函数的维度,默认是3,选择其他核函数时会被忽略 | 3 | |
核函数参数gamma | gamma | float | 核函数参数gamma,gamma是选择RBF函数作为kernel后,该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布,gamma越大,支持向量越少,gamma值越小,支持向量越多。支持向量的个数影响训练与预测的速度,-1表示默认值为1/n_features | -1 | |
核函数的常数项 | coef0 | float | 核函数的常数项,对于poly和 sigmoid有用 | 0.0 | |
停止训练的误差值大小 | tol | float | 停止训练的误差值大小,默认为1e-3 | 0.001 | |
最大迭代次数 | max_iter | int | 最大迭代次数,-1为无限制 | -1 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
# 回归
#自适应提升树-回归 (adaboost_regressor.v1)
adaboost自适应提升树算法,用于回归,此算法基于boosting,根据上次回归的效果确定下次训练每个样本的权值,将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的弱学习器融合,作为最后的回归模型。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 弱学习器个数 | n_estimators | int | 弱学习器个数,弱学习器最大迭代次数,太小容易欠拟合,太大容易过拟合,默认为50 | 50 |
学习率 | learning_rate | float | 学习率,该值缩减每个弱学习器的权重,通常较小的系数需要更多的迭代,因此n_estimators和learning_rate要一起调参 | 1.0 | |
损失函数 | loss | choice | 损失函数,每次增强迭代后更新权重时使用的损失函数,默认为线性 | linear | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#Bagging-回归 (bagging_regressor.v1)
Bagging有放回随机抽样算法,用于回归,有放回随机抽取小样本,训练弱学习器,通过平均获得最终回归结果。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 弱学习器个数 | n_estimators | int | 弱学习器个数,基准估计器个数,默认为10 | 10 |
随机子集比重 | subsample | float | 随机子集比重,训练基准估计器使用该随机子集 | 1.0 | |
特征使用率 | feature_fraction | float | 特征使用率,寻找最佳分割时要考虑的特征比率,float类型,默认考虑所有特征数,即取值1.0 | 1.0 | |
数据有放回抽样 | bootstrap | bool | 数据有放回抽样,是否有放回采样,默认为True | True | |
特征有放回抽样 | bootstrap_features | bool | 特征有放回抽样,是否对特征有放回采样,默认为False | False | |
采用袋外样本来评估误差 | oob_score | bool | 采用袋外样本来评估误差,是否使用袋外样本估计泛化误差,默认为False,评估结果保存在oob_score_ | False | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#决策树-回归 (decision_tree_regressor.v1)
决策树算法,用于回归,回归树遍历所有特征对空间进行划分,直到取到某个特征的某个值使损失函数最小,从而得到划分点。回归结果为子空间内的样本平均数。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 决定分割的标准 | criterion | choice | 决定分割的标准,支持均方误差mse,平均绝对误差mae及弗里德曼改进均方误差friedman_mse。默认是mse | mse |
特征使用率 | feature_fraction | float | 特征使用率:寻找最佳分割时要考虑的特征比率 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#极端随机森林-回归 (extra_trees_regressor.v1)
对于随机森林的优化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 决定分割的标准 | criterion | choice | 决定分割的标准,支持均方误差mse和平均绝对误差mae。默认是mse | mse |
树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 | |
特征使用率 | feature_fraction | float | 特征使用率:寻找最佳分割时要考虑的特征比率 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#梯度提升树-回归 (gradient_boosting_regressor.v1)
梯度提升树-回归。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 损失函数 | loss | choice | 损失函数,对于分类模型,有对数似然损失函数deviance和指数损失函数exponential | ls |
学习率 | learning_rate | float | 学习率,这个参数决定着每一个决策树对于最终结果的影响。GBM设定了初始的权重值之后,每一次树分类都会更新这个值,较小的值使得模型对不同的树更加稳健 | 0.1 | |
树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 | |
训练每个决策树所用到的子样本占总样本的比例 | subsample | float | 训练每个决策树所用到的子样本占总样本的比例,稍小于1的值能够使模型更稳健,因为这样减少了方差 | 1.0 | |
叶子节点最小样本数 | min_samples_per_leaf | int | 叶子节点最小样本数,int类型 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强 | 3 | |
特征使用率 | feature_fraction | float | 特征使用率,寻找最佳分割时要考虑的特征比率,float类型,默认考虑所有特征数,即取值1.0 | 1.0 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#k近邻-回归 (kneighbors_regressor.v1)
用于回归
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 近邻数 | n_neighbors | int | 近邻数,int类型,可选参数,默认值为5 | 5 |
K近邻权重类型 | weights | choice | K近邻权重类型,用于预测。默认值为uniform | uniform | |
计算分类使用的算法 | algorithm | choice | 计算分类使用的算法,可选参数,ball_tree为算法BallTree,kd_tree为KDTree,brute使用暴力搜索,auto基于传入内容使用合适算法。默认值为auto | auto | |
BallTree或者KDTree算法的叶子数量 | leaf_size | int | BallTree或者KDTree算法的叶子数量,int类型,可选参数,此参数会影响构建、查询BallTree或者KDTree的速度,以及存储BallTree或KDTree所需要的内存大小。默认值30 | 30 | |
距离度量 | metric | choice | 距离度量,默认为minkowski,也称欧式距离 | minkowski | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#线性-回归 (linear_regression.v1)
线性回归模型。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 是否计算该模型的截距 | fit_intercept | bool | 是否计算该模型的截距 | True |
回归X是否被规范化 | normalize | bool | 回归X是否被规范化,如果为True,回归X被规范化 | False | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#线性随机梯度下降-回归 (linear_sgd_regressor.v1)
线性随机梯度下降算法,用于回归。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 损失函数 | loss | choice | 损失函数 | huber |
正则类型 | penalty | choice | 正则类型 | l2 | |
L2 惩罚项(正则项) 参数 | alpha | float | L2 惩罚项(正则项) 参数 | 0.0001 | |
最大迭代次数 | max_iter | int | 最大迭代次数 | 5 | |
是否先随机打乱 | shuffle | bool | 是否先随机打乱 | True | |
初始学习率 | eta0 | float | 初始学习率 | 0.1 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#多层感知器-回归 (mlp_regressor.v1)
用于回归的机器学习算法。多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。可用于线性不可分数据。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 输入该隐藏层的神经元个数 | hidden_layer_sizes | str | 输入该隐藏层的神经元个数,用英文逗号(,)分隔的整数元组,例如 100,100,表示有两层隐藏层,第一层隐藏层有100个神经元,第二层也有100个神经元 | 100 |
隐藏层的激活函数类型 | activation | choice | 隐藏层的激活函数类型 | relu | |
优化器 | solver | choice | 优化器,用于优化权重,默认为adam | adam | |
L2 惩罚项(正则项) 参数 | alpha | float | L2 惩罚项(正则项) 参数 | 0.0001 | |
随机优化算法的批量大小 | batch_size | int | 随机优化算法的批量大小,如果优化器是 ‘lbfgs’, 将不会生效 | 200 | |
学习率的初始默认值 | learning_rate_init | float | 学习率的初始默认值,当且仅当优化策略是SGD或者ADAM时,才有意义。本参数控制着更新权重时的步长 | 0.001 | |
最大可迭代次数 | max_iter | int | 最大可迭代次数,优化器直至收敛(视最小容忍度而定)或者到达最大迭代次数时,算法停止 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果, 如果predict_ds为None, predictions也为None |
#随机森林-回归 (random_forest_regressor.v1)
随机森林算法,可以用做分类和回归类的训练。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 树的数量 | iterations | int | 树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源 | 10 |
特征使用率 | feature_fraction | float | 特征使用率:寻找最佳分割时要考虑的特征比率 | 1 | |
树的最大深度 | max_depth | int | 树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制 | 30 | |
每叶节点最小样本数 | min_samples_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 200 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#支持向量机-回归 (svr.v1)
支持向量回归。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 惩罚参数 | C | float | 惩罚参数,默认值1.0 | 1.0 |
核函数 | kernel | choice | 核函数 | rbf | |
多项式poly函数的维度 | degree | int | 多项式poly函数的维度,int类型,默认是3,使用其他核函数时会被忽略 | 3 | |
核函数系数 | gamma | float | 核函数系数,rbf/poly/sigmoid的系数,float类型,默认为1/n_features | -1 | |
核函数的常数项 | coef0 | float | 核函数的常数项,float类型,对于poly和sigmoid有用 | 0.0 | |
停止训练的误差值大小 | tol | float | 停止训练的误差值大小,float类型 | 0.001 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
# 排序
#StockRanker (stock_ranker.v2)
StockRanker训练和预测,该模块将训练和预测整合到一起,返回模型和预测结果。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练-数据(如果传入则需要指定模型输入) | training_ds | 通用 | 训练-数据(如果传入则需要指定模型输入) | None |
训练-特征 | features | 通用 | 训练-特征 | None | |
训练-基础模型(可以在此模型上做继续训练(continue train)) | base_model | 通用 | 训练-基础模型(可以在此模型上做继续训练(continue train)) | None | |
训练-测试数据集 | test_ds | 通用 | 训练-测试数据集,可用于在训练阶段查看训练效果,来做模型参数和特征等的调优;通过配置early stop参数可以让训练提前终止 | None | |
预测-模型 | input_model | 通用 | 预测-模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测-数据 | predict_ds | 通用 | 预测-数据,如果不设置,则不做预测 | None | |
输入参数 | 学习算法 | learning_algorithm | choice | 学习算法,机器学习优化算法 | 排序 |
叶节点数量 | number_of_leaves | int | 叶节点数量:每棵树最大叶节点数量。一般情况下,叶子节点越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 30 | |
每叶节点最小样本数 | minimum_docs_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 1000 | |
树的数量 | number_of_trees | int | 树的数量,一般情况下,树越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 20 | |
学习率 | learning_rate | float | 学习率,学习率如果太大,可能会使结果越过最优值,如果太小学习会很慢 | 0.1 | |
特征值离散化数量 | max_bins | int | 特征值离散化数量:一般情况下,max_bins越大,则学的越细,过拟合的可能性也越高 | 1023 | |
特征列采样率 | feature_fraction | float | 特征列采样率:在构建每一颗树时,每个特征被使用的概率,如果为1,则每棵树都会使用所有特征列 | 1 | |
数据行采样率 | data_row_fraction | float | 数据行采样率:在构建每一颗树时,每个样本数据被使用的概率,如果为1,则每棵树都会使用所有数据行 | 1 | |
NDCG discount base | ndcg_discount_base | float | NDCG discount base:用于计算NDCG的 discount = log2(base + position),其中position从1开始。base越大,位置的影响越小 | 1 | |
压缩数据列 | slim_data | bool | 压缩数据列,移除不需要使用的列。一般设置为True | True | |
滚动运行参数 | rolling_input | doc | 滚动运行参数,接收来自滚动运行的输入,用于训练数据过滤 | None | |
输出端 | 训练出来的模型 | model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#StockRanker模型组合 (stock_ranker_combine.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 基础模型 | base_model_id | 通用 | 基础模型 | *必填 |
继续训练的模型 | combine_model_id | 通用 | 继续训练的模型 | *必填 | |
输入参数 | 条件表达式 | combine_condition | str | 条件表达式 | *必填 |
输出端 | 模型 | model_id | 通用 | 模型 |
#StockRanker预测 (stock_ranker_predict.v5)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | model | 通用 | 模型 | *必填 |
数据 | data | 通用 | 数据 | *必填 | |
输出端 | 预测结果 | predictions | 通用 | 预测结果 | |
延迟运行 | m_lazy_run | 通用 | 延迟运行,将当前模块打包,可以作为其他模块的输入,在其他模块里运行。启用需要勾选模块的 延迟运行 参数。 |
#StockRanker预测(GBDT) (stock_ranker_predict_gbdt.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | model | 通用 | 模型 | *必填 |
数据 | data | 通用 | 数据 | *必填 | |
输出端 | 预测结果 | predictions | 通用 | 预测结果 | |
延迟运行 | m_lazy_run | 通用 | 延迟运行,将当前模块打包,可以作为其他模块的输入,在其他模块里运行。启用需要勾选模块的 延迟运行 参数。 |
#StockRanker训练 (stock_ranker_train.v6)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,需要包含所有用到的特征数据,包括基础特征和衍生特征 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
评估测试数据集 | test_ds | 通用 | 评估测试数据集,可用于在训练阶段查看训练效果,来做模型参数和特征等的调优;通过配置early stop参数可以让训练提前终止 | None | |
基础模型 | base_model | 通用 | 基础模型,可以在此模型上继续训练 | None | |
输入参数 | 学习算法 | learning_algorithm | choice | 学习算法,机器学习优化算法 | 排序 |
叶节点数量 | number_of_leaves | int | 叶节点数量:每棵树最大叶节点数量。一般情况下,叶子节点越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 30 | |
每叶节点最小样本数 | minimum_docs_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 1000 | |
树的数量 | number_of_trees | int | 树的数量:一般情况下,树越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 20 | |
学习率 | learning_rate | float | 学习率:学习率如果太大,可能会使结果越过最优值,如果太小学习会很慢 | 0.1 | |
特征值离散化数量 | max_bins | int | 特征值离散化数量:一般情况下,max_bins越大,则学的越细,过拟合的可能性也越高 | 1023 | |
特征列采样率 | feature_fraction | float | 特征列采样率:在构建每一颗树时,每个特征被使用的概率,如果为1,则每棵树都会使用所有特征列 | 1 | |
数据行采样率 | data_row_fraction | float | 数据行采样率:在构建每一颗树时,每个样本数据被使用的概率,如果为1,则每棵树都会使用所有数据行 | 1 | |
NDCG discount base | ndcg_discount_base | float | NDCG discount base:用于计算NDCG的 discount = log2(base + position),其中position从1开始。base越大,位置的影响越小 | 1 | |
滚动运行参数 | rolling_input | doc | 滚动运行参数,接收来自滚动运行的输入,用于训练数据过滤 | None | |
输出端 | 模型 | model | 通用 | 模型 | |
特征贡献 | feature_gains | 通用 | 特征贡献 | ||
延迟运行 | m_lazy_run | 通用 | 延迟运行,将当前模块打包,可以作为其他模块的输入,在其他模块里运行。启用需要勾选模块的 延迟运行 参数。 |
#StockRanker训练(GBDT) (stock_ranker_train_gbdt.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,需要包含所有用到的特征数据,包括基础特征和衍生特征 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
输入参数 | 学习算法 | learning_algorithm | choice | 学习算法,机器学习优化算法 | 排序 |
叶节点数量 | number_of_leaves | int | 叶节点数量:每棵树最大叶节点数量。一般情况下,叶子节点越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 30 | |
每叶节点最小样本数 | minimum_docs_per_leaf | int | 每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好 | 30 | |
树的数量 | number_of_trees | int | 树的数量:一般情况下,树越多,则模型越复杂,表达能力越强,过拟合的可能性也越高 | 100 | |
学习率 | learning_rate | float | 学习率:学习率如果太大,可能会使结果越过最优值,如果太小学习会很慢 | 0.1 | |
特征值离散化数量 | max_bins | int | 特征值离散化数量:一般情况下,max_bins越大,则学的越细,过拟合的可能性也越高 | 256 | |
滚动运行参数 | rolling_input | doc | 滚动运行参数,接收来自滚动运行的输入,用于训练数据过滤 | None | |
输出端 | 模型 | model | 通用 | 模型 | |
特征贡献 | feature_gains | 通用 | 特征贡献 | ||
延迟运行 | m_lazy_run | 通用 | 延迟运行,将当前模块打包,可以作为其他模块的输入,在其他模块里运行。启用需要勾选模块的 延迟运行 参数。 |
# 聚类
#近邻传播-聚类 (cluster_affinity_propagation.v1)
近邻传播算法,用于聚类,此算法为半监督,首先通过消息传递机制来搜索网络中各个数据点的聚类中心以及数据点与数据中心之间的隶属关系,然后根据数据中心和顶点之间的隶属关系来对待聚类数据集进行划分,形成若干个具有特定意义的子集。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 阻尼系数 | damping | float | 阻尼系数,取值在0.5到1之间,减少算法迭代产生震荡 | 0.5 |
最大迭代次数 | iterations | int | 最大迭代次数,默认为200 | 200 | |
算法收敛迭代次数 | convergence_iter | int | 算法收敛迭代次数,直到分类数没有变化时算法的迭代次数,默认为15 | 15 | |
复制输入数据 | copy | bool | 复制输入数据,是否复制输入数据,默认为True | True | |
距离度量方法 | affinity | choice | 距离度量方法,距离度量,目前支持precomputed和euclidean | euclidean | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#层次-聚类 (cluster_agglomerative.v1)
层次算法,用于聚类,通过计算不同类别的相似度类创建一个有层次的嵌套的树。在聚类树中,先找出和每个点最近似的点两两聚类,然后反复迭代这一过程,直到聚类完成。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 分类簇数量 | n_clusters | int | 分类簇数量,默认为2 | 2 |
距离度量方法 | affinity | choice | 距离度量方法,度量的方法,包括cosine,manhattan,euclidean等 | euclidean | |
连接算法 | linkage | choice | 连接算法,如果使用ward,则距离度量只能使用euclidean | ward | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#Birch-聚类 (cluster_birch.v1)
Birch算法,用于聚类,作为一种层次聚类算法,BIRCH只需要单遍扫描数据集就能进行聚类。
其他参数:n_clusters:分类簇的数量,在类别数特别多,没有先验知识的情况下,n_clusters可用None,即直接读取叶子结点中的子聚类。默认为3
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 输出时表示类别 | compute_labels | bool | 输出时表示类别,是否标示类别输出,默认为True | True |
簇半径阈值 | threshold | float | 簇半径阈值,限制新加入的样本和存在与现有子集群中样本的最大距离,默认为0.5 | 0.5 | |
分支因子 | branching_factor | int | 分支因子,限制一个节点中的子集群的数量,默认是50 | 50 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#DBSCAN-聚类 (cluster_dbscan.v1)
DBSCAN算法,用于聚类,
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 邻域的距离阈值 | eps | float | 邻域的距离阈值,两样本间最大距离 | 0.5 |
最小样本数 | min_samples | int | 最小样本数,核心点邻域中最小样本数,包括点本身 | 5 | |
k-means算法调节 | algorithm | choice | k-means算法调节,支持蛮力实现、KD树实现、球树实现,默认为自动选取最优 | auto | |
关键列的数据会复制到预测结果里 | key_cols | str | 关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#K均值-聚类 (cluster_kmeans.v1)
K-means算法,用于聚类,先随机初始化各自的中心点,然后计算每个数据点到中心点的距离,将数据点划分到最近的中心点类别。然后用每一类的中心点作为新的中心点,重复迭代,直到迭代后变化不大为止。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 簇的个数 | n_clusters | int | 簇的个数,聚类中心数量,默认为8 | 8 |
质心初始化方法 | init | choice | 质心初始化方法,默认为k-means++ | k-means++ | |
质心初始化次数 | n_init | int | 质心初始化次数,初始化质心的次数,默认为10 | 10 | |
最大迭代次数 | iterations | int | 最大迭代次数,迭代得到最终质心的次数 | 300 | |
K-Means算法 | algorithm | choice | K-Means算法,auto选择elkan表示密集数据,full表示稀疏数据 | auto | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
#谱-聚类 (cluster_spectral.v1)
用于聚类,将图论应用于聚类。把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要指定模型输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 分类簇的数量 | n_clusters | int | 分类簇的数量,切图时降到的维数 | 3 |
相似矩阵的建立方式 | affinity | choice | 相似矩阵的建立方式,为nearest_neighbors时忽略参数gamma,默认为rbf | rbf | |
近邻个数 | n_neighbors | int | 近邻个数,KNN算法的K的个数,默认是10,affinity为nearest_neighbors忽略此参数 | 10 | |
特征值分解策略 | eigen_solver | choice | 特征值分解策略,amg存在稳定性问题,平台暂不支持 | None | |
停止拉普拉斯矩阵特征分解条件 | eigen_tol | float | 停止拉普拉斯矩阵特征分解条件,当eigen_solver为eigen_solver时生效 | 0.0 | |
K-Means聚类的运行次数 | n_init | int | K-Means聚类的运行次数,最终结果是连续运行后的最佳输出 | 10 | |
核系数 | gamma | float | 核系数,rbf,poly,sigmoid,laplacian和chi2的核系数 | 1.0 | |
聚类方法 | assign_labels | choice | 聚类方法,常用kmeans,但对质心初始化较敏感,discretize则不敏感 | kmeans | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
并行作业数 | workers | int | 并行作业数,同时使用多少个进程进行计算,默认是1 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
训练数据集 | transform_trainds | 通用 | 训练数据集,聚类训练结果为列label | ||
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
# 特征预处理
#主成分分析降维 (decomposition_pca.v1)
主成分分析,主要功能为降维,是数据预处理的一个步骤。通过主成分分析对于原特征进行线性组合,得到影响力最大的新特征并输出。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 主成分特征个数 | n_components | int | 主成分特征个数,希望PCA降维后的特征维度数目 | 1 |
白化 | whiten | bool | 白化,使得每个特征具有相同的方差 | False | |
其他训练参数 | other_train_parameters | code | 其他训练参数,字典格式,例:{'criterion': 'mse'} | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
降维后的特征 | pca_features | 通用 | 降维后的特征 | ||
降维后训练集 | transform_trainds | 通用 | 降维后训练集,降维特征通过属性pca_features查看 | ||
降维后预测集 | transform_predictds | 通用 | 降维后预测集,降维特征通过属性pca_features查看 |
#最大绝对值归一化 (preprocessing_max_abs_scaler.v1)
最大绝对值归一化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
转换后训练集 | transform_trainds | 通用 | 转换后训练集 | ||
转换后预测集 | transform_predictds | 通用 | 转换后预测集 |
#特征缩放 (preprocessing_min_max_scaler.v1)
将特征值缩放到一定范围内。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 特征缩放下限 | feature_range_low | int | 特征缩放下限,将特征缩放到执行范围之间 | 0 |
特征缩放上限 | feature_range_high | int | 特征缩放上限,将特征缩放到执行范围之间 | 1 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
转换后训练集 | transform_trainds | 通用 | 转换后训练集 | ||
转换后预测集 | transform_predictds | 通用 | 转换后预测集 |
#标准化 (preprocessing_normalizer.v1)
标准化处理。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 标准化方法 | norm | choice | 标准化方法 | l2 |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
标准化训练集 | transform_trainds | 通用 | 标准化训练集 | ||
标准化预测集 | transform_predictds | 通用 | 标准化预测集 |
#序数编码 (preprocessing_ordinal_encoder.v1)
序数编码。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
转换后训练集 | transform_trainds | 通用 | 转换后训练集 | ||
转换后预测集 | transform_predictds | 通用 | 转换后预测集 |
#RobustScaler标准化 (preprocessing_robust_scaler.v1)
RobustScaler 针对离群点做标准化处理。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 中心化 | with_centering | bool | 中心化 | True |
数据是否按分位数缩放 | with_scaling | bool | 数据是否按分位数缩放 | True | |
缩放分位数下限 | quantile_range_min | float | 缩放分位数下限,介于0.0到100.0之间 | 25.0 | |
缩放分位数上限 | quantile_range_max | float | 缩放分位数上限,介于0.0到100.0之间 | 75.0 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
转换后训练集 | transform_trainds | 通用 | 转换后训练集 | ||
转换后预测集 | transform_predictds | 通用 | 转换后预测集 |
#StandardScaler标准化 (preprocessing_standard_scaler.v1)
标准化处理,使得数据平均值是0并且有相同阶数的方差。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据,如果传入,则需要特征指定输入 | None |
特征 | features | 通用 | 特征,用于训练 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 中心化 | with_mean | bool | 中心化 | True |
缩放到单位标准差 | with_std | bool | 缩放到单位标准差 | True | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
转换后训练集 | transform_trainds | 通用 | 转换后训练集 | ||
转换后预测集 | transform_predictds | 通用 | 转换后预测集 |
# 其他
#GBDT预测 (GBDT_predict.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | model | 通用 | 模型,参考 :doc: | *必填 |
待预测数据集 | data | 通用 | 待预测数据集 | *必填 | |
输入参数 | 日期列名 | date_col | str | 日期列名,如果在表达式中用到切面相关函数时,比如 rank,会用到此列名 | date |
证券代码列名 | instrument_col | str | 证券代码列名,如果在表达式中用到时间序列相关函数时,比如 shift,会用到此列名 | instrument | |
是否对结果排序 | sort | bool | 是否对结果排序 | True | |
输出端 | 预测结果 | predictions | 通用 | 预测结果 |
#GBDT训练 (GBDT_train.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据 | *必填 |
因子/特征 | features | 通用 | 因子/特征,支持基础特征和衍生特征 | *必填 | |
验证数据 | test_ds | 通用 | 验证数据 | None | |
输入参数 | 迭代次数 | num_boost_round | int | 迭代次数 | 120 |
提前停止检测次数 | early_stopping_rounds | int | 提前停止检测次数,停止训练的的检测次数 | None | |
损失函数类型 | objective | choice | 损失函数类型 | reg:linear | |
类别个数 | num_class | int | 类别个数,如果使用multi:softprob需要设置 | None | |
评价指标 | eval_metric | choice | 评价指标 | error | |
模型 | booster | choice | 模型 | gbtree | |
学习率 | eta | float | 学习率 | 0.1 | |
最小节点分裂损失值 | gamma | float | 最小节点分裂损失值 | 0.0001 | |
L2正则 | _lambda | float | L2正则 | 0 | |
L2正则偏置 | lambda_bias | float | L2正则偏置 | 0 | |
L1正则 | alpha | float | L1正则 | 0 | |
树的最大深度 | max_depth | int | 树的最大深度 | 6 | |
树最多叶子个数 | max_leaf_nodes | int | 树最多叶子个数 | 30 | |
随机采样比例 | subsample | float | 随机采样比例 | 0.8 | |
参数字典 | xgb_param | code | 参数字典 | 默认代码 | |
输出端 | 训练出来的模型 | model | 通用 | 训练出来的模型 |
#LightGBM (lightgbm.v1)
LightGBM模块,可以用做排序、分类和回归类的训练。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据 | None |
因子/特征 | features | 通用 | 因子/特征,支持基础特征和衍生特征 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 迭代次数 | num_boost_round | int | 迭代次数 | 30 |
损失函数类型 | objective | choice | 损失函数类型 | 排序(ndcg) | |
树最大叶子个数 | num_leaves | int | 树最大叶子个数 | 30 | |
学习率 | learning_rate | float | 学习率 | 0.1 | |
每个叶子最少样本数 | min_data_in_leaf | int | 每个叶子最少样本数 | 200 | |
特征值离散化数量 | max_bin | int | 特征值离散化数量 | 255 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
群组标识列 | group_col | str | 群组标识列,排序类任务,只有group_col相同的才需要排序, 默认不需要改 | date | |
参数字典 | other_train_parameters | code | 参数字典 | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None | ||
特征贡献 | feature_gains | 通用 | 特征贡献 |
#线性模型预测(SGD) (linear_sgd_predict.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | model | 通用 | 模型,参考 :doc: | *必填 |
待预测数据集 | data | 通用 | 待预测数据集 | *必填 | |
输出端 | 预测结果 | predictions | 通用 | 预测结果 |
#线性模型训练(SGD) (linear_sgd_train.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据 | *必填 |
因子/特征 | features | 通用 | 因子/特征,支持基础特征和衍生特征 | *必填 | |
训练时用的测试集 | test_ds | 通用 | 训练时用的测试集,可以根据此数据集上的预测效果,来做模型参数和特征等的调整 | None | |
输入参数 | 损失函数类型 | loss | choice | 损失函数类型 | auto |
正则类型 | penalty | choice | 正则类型 | l2 | |
正则损失函数的系数 | alpha | float | 正则损失函数的系数 | 0.0001 | |
训练迭代次数 | n_iter | int | 训练迭代次数 | 5 | |
训练时 | shuffle | bool | 训练时,是否先随机打乱 | True | |
初始学习率 | eta0 | float | 初始学习率 | 0.1 | |
算法类型 | algo | choice | 算法类型,classifier是分类算法,regressor是回归算法 | classifier | |
输出端 | 训练出来的模型 | model | 通用 | 训练出来的模型 |
#随机森林预测 (random_forest_predict.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | model | 通用 | 模型,参考 :doc: | *必填 |
待预测数据集 | data | 通用 | 待预测数据集 | *必填 | |
输入参数 | 日期列名 | date_col | str | 日期列名,如果在表达式中用到切面相关函数时,比如 rank,会用到此列名 | date |
证券代码列名 | instrument_col | str | 证券代码列名,如果在表达式中用到时间序列相关函数时,比如 shift,会用到此列名 | instrument | |
是否对结果排序 | sort | bool | 是否对结果排序 | True | |
输出端 | 预测结果 | predictions | 通用 | 预测结果 |
#随机森林训练 (random_forest_train.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据 | *必填 |
因子/特征 | features | 通用 | 因子/特征,支持基础特征和衍生特征 | *必填 | |
训练时用的测试集 | test_ds | 通用 | 训练时用的测试集,可以根据此数据集上的预测效果,来做模型参数和特征等的调整。为None,表示不使用测试集 | None | |
输入参数 | 树的个数 | n_estimators | int | 树的个数,个数越多,则模型越复杂,计算速度越慢 | 10 |
最多考虑特征个数 | max_features | str | 最多考虑特征个数,新建节点时,最多考虑的特征个数。默认为auto,一般不需要更改 | auto | |
数据的最大深度 | max_depth | int | 数据的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为None则不限制 | 30 | |
每个叶子节点最少样本数 | min_samples_leaf | int | 每个叶子节点最少样本数,数值大泛化能力强,数值小拟合能力强 | 200 | |
并行度 | n_jobs | int | 并行度,同时使用多少个进程进行计算 | 1 | |
随机数种子 | random_state | int | 随机数种子,默认是0 | 0 | |
算法类型 | algo | choice | 算法类型,classifier是分类算法,regressor是回归算法 | regressor | |
输出端 | 训练出来的模型 | model | 通用 | 训练出来的模型 |
#XGBoost (xgboost.v1)
xgboost模块,可以用做排序、分类和回归类的训练。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | training_ds | 通用 | 训练数据 | None |
因子/特征 | features | 通用 | 因子/特征,支持基础特征和衍生特征 | None | |
模型 | model | 通用 | 模型,用于预测,如果不指定训练数据,则使用此模型预测 | None | |
预测数据 | predict_ds | 通用 | 预测数据,如果不设置,则不做预测 | None | |
输入参数 | 迭代次数 | num_boost_round | int | 迭代次数 | 30 |
损失函数类型 | objective | choice | 损失函数类型 | 排序(pairwise) | |
模型 | booster | choice | 模型 | gbtree | |
树的最大深度 | max_depth | int | 树的最大深度 | 6 | |
关键列 | key_cols | str | 关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔 | date,instrument | |
群组标识列 | group_col | str | 群组标识列,排序类任务,只有group_col相同的才需要排序, 默认不需要改 | date | |
并行线程数 | nthread | int | 并行线程数,默认为1 | 1 | |
gpu个数 | n_gpus | int | gpu个数,本模块使用的gpu个数,-1表示自动,0表示不用GPU,1表示使用1个GPU | -1 | |
参数字典 | other_train_parameters | code | 参数字典 | 默认代码 | |
输出端 | 训练出来的模型 | output_model | 通用 | 训练出来的模型 | |
预测结果 | predictions | 通用 | 预测结果,如果predict_ds为None,predictions也为None |
# 深度学习
# 模型
#构建(深度学习) (dl_model_init.v1)
构造一个拥有输入和输出的模型。我们使用Model来初始化构造一个函数式模型。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输出 | outputs | 通用 | 输出 | None | |
输出端 | 模型 | data | 通用 | 模型 |
#预测(深度学习) (dl_model_predict.v1)
深度学习模型预测。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型 | trained_model | 通用 | 模型 | *必填 |
数据 | input_data | 通用 | 数据,pickle格式dict,包含x | *必填 | |
输入参数 | batch_size | batch_size | int | batch_size,进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降,使目标函数优化一步。 | 32 |
gpu个数 | n_gpus | int | gpu个数,本模块使用的gpu个数 | 0 | |
日志输出 | verbose | choice | 日志输出 | 2:每个epoch输出一行记录 | |
输出端 | 预测结果 | data | 通用 | 预测结果 |
#训练(深度学习) (dl_model_train.v1)
深度学习模型模型编译和训练。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 模型结构 | input_model | 通用 | 模型结构 | *必填 |
训练数据 | training_data | 通用 | 训练数据,pickle格式dict,包含x和y | *必填 | |
验证数据 | validation_data | 通用 | 验证数据,pickle格式dict,包含x和y | None | |
输入参数 | 优化器 | optimizer | choice | 优化器,optimizer,优化器使用的是使用默认参数,如果需要修改参数,可以使用自定义优化器 | SGD |
自定义优化器 | user_optimizer | code | 自定义优化器,示例: from tensorflow.keras import optimizers bigquant_run=optimizers.SGD(lr=0.01, clipvalue=0.5) | 默认代码 | |
目标函数 | loss | choice | 目标函数,loss,目标函数/损失函数 | mean_squared_error | |
自定义目标函数 | user_loss | code | 自定义目标函数,示例: from tensorflow.keras import losses bigquant_run=losses.mean_squared_error | 默认代码 | |
评估指标 | metrics | str | 评估指标,包含评估模型在训练和测试时的性能的指标,多个指标用英文逗号(,)分隔。示例:mse,accuracy | None | |
batch_size | batch_size | int | batch_size,进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降,使目标函数优化一步。 | 32 | |
epochs | epochs | int | epochs,训练终止时的epoch值,训练将在达到该epoch值时停止,当没有设置initial_epoch时,它就是训练的总轮数,否则训练的总轮数为epochs - inital_epoch | 1 | |
gpu个数 | n_gpus | int | gpu个数,本模块使用的gpu个数 | 0 | |
日志输出 | verbose | choice | 日志输出 | 2:每个epoch输出一行记录 | |
输出端 | 训练后的模型 | data | 通用 | 训练后的模型 |
# 包装器
#Bidirectional层 (dl_layer_bidirectional.v1)
双向RNN包装器
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入层 | layer | 通用 | 输入层 | *必填 |
输入 | inputs | 通用 | 输入 | None | |
输入参数 | merge_mode | merge_mode | choice | merge_mode,Mode by which outputs of the forward and backward RNNs will be combined. 前向和后向RNN输出的结合方式,为sum,mul,concat,ave和None之一,若设为None,则返回值不结合,而是以列表的形式返回 | None |
weights | weights | str | weights,列表,列表用英文逗号(,)分隔,例如 1,2 | None | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#TimeDistributed层 (dl_layer_timedistributed.v1)
该包装器可以把一个层应用到输入的每一个时间步上。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入层 | layer | 通用 | 输入层 | *必填 |
输入 | inputs | 通用 | 输入 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
# 卷积层
#Conv1D层 (dl_layer_conv1d.v1)
一维卷积层(即时域卷积),用以在一维输入信号上进行邻域滤波。当使用该层作为首层时,需要提供关键字参数input_shape。例如(10,128)代表一个长为10的序列,序列中每个信号为128向量。而(None, 128)代表变长的128维向量序列。
该层生成将输入信号与卷积核按照单一的空域(或时域)方向进行卷积。如果use_bias=True,则还会加上一个偏置项,若activation不为None,则输出为经过激活函数的输出。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
步长 | strides | str | 步长,strides,卷积的步长。整数列表,列表用英文逗号(,)分隔,例如 12,34 | 1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 或“causal”,“causal”将产生因果(膨胀的)卷积,即output[t]不依赖于input[t+1:]。当对不能违反时间顺序的时序信号建模时有用。参考WaveNet: A Generative Model for Raw Audio, section 2.1.。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
dilation_rate | dilation_rate | int | dilation_rate,整数,指定dilated convolution中的膨胀比例。任何不为1的dilation_rate均与任何不为1的strides均不兼容。 | 1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | Zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Conv2D层 (dl_layer_conv2d.v1)
二维卷积层,即对图像的空域卷积。该层对二维输入进行滑动窗卷积,当使用该层作为第一层时,应提供input_shape参数。例如input_shape = (128,128,3)代表128*128的彩色RGB图像(data_format='channels_last')
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
步长 | strides | str | 步长,strides,卷积的步长。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | 1,1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
dilation_rate | dilation_rate | str | dilation_rate,整数或由2个整数构成的list/tuple,指定dilated convolution中的膨胀比例。任何不为1的dilation_rate均与任何不为1的strides均不兼容。 | 1,1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | Zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Conv2DTranspose层 (dl_layer_conv2dtranspose.v1)
该层是转置的卷积操作(反卷积)。需要反卷积的情况通常发生在用户想要对一个普通卷积的结果做反方向的变换。例如,将具有该卷积层输出shape的tensor转换为具有该卷积层输入shape的tensor。同时保留与卷积层兼容的连接模式。
当使用该层作为第一层时,应提供input_shape参数。例如input_shape = (3,128,128)代表128*128的彩色RGB图像
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
卷积的步长 | strides | str | 卷积的步长,strides,单个整数或由两个整数构成的list/tuple,为卷积的步长。如为单个整数,则表示在各个空间维度的相同步长。任何不为1的strides均与任何不为1的dilation_rate均不兼容。用英文逗号(,)分隔的整数列表,例如 10,20 | 1,1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
dilation_rate | dilation_rate | str | dilation_rate,整数或由2个整数构成的list/tuple,指定dilated convolution中的膨胀比例。任何不为1的dilation_rate均与任何不为1的strides均不兼容。 | 1,1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Conv3D层 (dl_layer_conv3d.v1)
三维卷积对三维的输入进行滑动窗卷积,当使用该层作为第一层时,应提供input_shape参数。例如input_shape = (3,10,128,128)代表对10帧128*128的彩色RGB图像进行卷积。数据的通道位置仍然有data_format参数指定。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
卷积的步长 | strides | str | 卷积的步长,strides,单个整数或由3个整数构成的list/tuple,为卷积的步长。如为单个整数,则表示在各个空间维度的相同步长。任何不为1的strides均与任何不为1的dilation_rate均不兼容 | 1,1,1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
dilation_rate | dilation_rate | str | dilation_rate,单个整数或由3个个整数构成的list/tuple,指定dilated convolution中的膨胀比例。任何不为1的dilation_rate均与任何不为1的strides均不兼容。 | 1,1,1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Cropping1D层 (dl_layer_cropping1d.v1)
在时间轴(axis1)上对1D输入(即时间序列)进行裁剪
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | cropping | cropping | str | cropping,长为2的tuple,指定在序列的首尾要裁剪掉多少个元素,用英文逗号(,)分隔的整数列表,例如 10 或者 32,24 | 1,1 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Cropping2D层 (dl_layer_cropping2d.v1)
对2D输入(图像)进行裁剪,将在空域维度,即宽和高的方向上裁剪 (e.g. picture).
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | cropping | cropping | str | cropping,长为4的列表,2个一组,分别为宽和高方向上头部与尾部需要裁剪掉的元素数。列表用英文逗号(,)分隔的整数列表,例如 10 或者 32,24 | 0,0,0,0 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Cropping3D层 (dl_layer_cropping3d.v1)
对3D输入(图像)进行裁剪 (e.g. spatial or spatio-temporal).
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | cropping | cropping | str | cropping,长为6的列表,2个一组,分别为三个方向上头部与尾部需要裁剪掉的元素数。列表用英文逗号(,)分隔的整数列表,例如 10 或者 32,24 | 1,1,1,1,1,1 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#SeparableConv2D层 (dl_layer_separableconv2d.v1)
该层是在深度方向上的可分离卷积。可分离卷积首先按深度方向进行卷积(对每个输入通道分别卷积),然后逐点进行卷积,将上一步的卷积结果混合到输出通道中。参数depth_multiplier控制了在depthwise卷积(第一步)的过程中,每个输入通道信号产生多少个输出通道。直观来说,可分离卷积可以看做讲一个卷积核分解为两个小的卷积核,或看作Inception模块的一种极端情况。当使用该层作为第一层时,应提供input_shape参数。例如input_shape = (3,128,128)代表128*128的彩色RGB图像。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
卷积的步长 | strides | str | 卷积的步长,strides,如为单个整数,则表示在各个空间维度的相同步长。任何不为1的strides均与任何不为1的dilation_rate均不兼容。用英文逗号(,)分隔的整数列表 | 1,1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
depth_multiplier | depth_multiplier | str | depth_multiplier,The number of depthwise convolution output channels for each input channel. The total number of depthwise convolution output channels will be equal to filterss_in * depth_multiplier . | 1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
depthwise_initializer | depthwise_initializer | choice | depthwise_initializer,Initializer for the depthwise kernel matrix,使用的是使用默认参数 | glorot_uniform | |
自定义depthwise_initializer | user_depthwise_initializer | code | 自定义depthwise_initializer,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
pointwise_initializer | pointwise_initializer | choice | pointwise_initializer,Initializer for the pointwise kernel matrix,使用的是使用默认参数 | glorot_uniform | |
自定义pointwise_initializer | user_pointwise_initializer | code | 自定义pointwise_initializer,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
depthwise_regularizer | depthwise_regularizer | choice | depthwise_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
depthwise_regularizer L1 | depthwise_regularizer_l1 | float | depthwise_regularizer L1,如果使用L1L2正则化,此参数有效 | 0 | |
depthwise_regularizer L2 | depthwise_regularizer_l2 | float | depthwise_regularizer L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义depthwise_regularizer | user_depthwise_regularizer | code | 自定义depthwise_regularizer,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
pointwise_regularizer | pointwise_regularizer | choice | pointwise_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
pointwise_regularizer L1 | pointwise_regularizer_l1 | float | pointwise_regularizer L1,如果使用L1L2正则化,此参数有效 | 0 | |
pointwise_regularizer L2 | pointwise_regularizer_l2 | float | pointwise_regularizer L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义pointwise_regularizer | user_pointwise_regularizer | code | 自定义pointwise_regularizer,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
depthwise_constraint | depthwise_constraint | choice | depthwise_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义depthwise_constraint | user_depthwise_constraint | code | 自定义depthwise_constraint,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
pointwise_constraint | pointwise_constraint | choice | pointwise_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义pointwise_constraint | user_pointwise_constraint | code | 自定义pointwise_constraint,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#UpSampling1D层 (dl_layer_upsampling1d.v1)
Upsampling layer for 1D inputs。在时间轴上,将每个时间步重复length次。输入形如(samples,steps,features)的3D张量,输出形如(samples,upsampled_steps,features)的3D张量。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 上采样因子 | size | int | 上采样因子,size | 2 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#UpSampling2D层 (dl_layer_upsampling2d.v1)
Upsampling layer for 2D inputs. 将数据的行和列分别重复size[0]和size[1]次。输入和输出均为4D张量。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | size | size | str | size,长为2的列表,分别为行和列上采样因子。列表用英文逗号(,)分隔的整数列表,例如 10 或者 32,24 | 2,2 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#UpSampling3D层 (dl_layer_upsampling3d.v1)
Upsampling layer for 3D inputs. 将数据的三个维度上分别重复size[0]、size[1]和ize[2]次。输入和输出均为5D张量。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | size | size | str | size,长为3的列表,分别为行和列上采样因子。列表用英文逗号(,)分隔的整数列表,例如 10 或者 32,24 | 2,2,2 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#ZeroPadding1D层 (dl_layer_zeropadding1d.v1)
对1D输入的首尾端(如时域序列)填充0,以控制卷积以后向量的长度。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | padding | padding | int | padding,表示在要填充的轴的起始和结束处填充0的数目,这里要填充的轴是轴1(第1维,第0维是样本数) | 1 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#ZeroPadding2D层 (dl_layer_zeropadding2d.v1)
对2D输入(如图片)的边界填充0,以控制卷积以后特征图的大小。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | padding | padding | str | padding,表示在要填充的轴的起始和结束处填充0的数目,这里要填充的轴是轴3和轴4(即在'th'模式下图像的行和列,在‘channels_last’模式下要填充的则是轴2,3)。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | 2,2 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#ZeroPadding3D层 (dl_layer_zeropadding3d.v1)
将数据的三个维度上填充0。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | padding | padding | str | padding,长为3的整数列表,列表用英文逗号(,)分隔的整数列表,例如 32,24。表示在要填充的轴的起始和结束处填充0的数目,这里要填充的轴是轴3,轴4和轴5,‘channels_last’模式下则是轴2,3和4 | 1,1,1 |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 噪声层
#AlphaDropout层 (dl_layer_alphadropout.v1)
对输入施加Alpha Dropout。Alpha Dropout是一种保持输入均值和方差不变的Dropout,该层的作用是即使在dropout时也保持数据的自规范性。 通过随机对负的饱和值进行激活,Alphe Drpout与selu激活函数配合较好。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | dropout率 | rate | float | dropout率,断连概率,与Dropout层相同 | *必填 |
noise_shape | noise_shape | str | noise_shape,noise_shape。整数列表,列表用英文逗号(,)分隔,例如 12,34 | None | |
随机数种子 | seed | int | 随机数种子,整数 | None | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GaussianDropout层 (dl_layer_gaussiandropout.v1)
为层的输入施加以1为均值,标准差为sqrt(rate/(1-rate)的乘性高斯噪声
因为这是一个起正则化作用的层,该层只在训练时才有效。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | rate | rate | float | rate,drop probability (as with Dropout ). The multiplicative noise will have standard deviation sqrt(rate / (1 - rate)). 断连概率,与Dropout层相同 | *必填 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GaussianNoise层 (dl_layer_gaussiannoise.v1)
为数据施加0均值,标准差为stddev的加性高斯噪声。该层在克服过拟合时比较有用,你可以将它看作是随机的数据提升。高斯噪声是需要对输入数据进行破坏时的自然选择。因为这是一个起正则化作用的层,该层只在训练时才有效。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | stddev | stddev | float | stddev,代表要产生的高斯噪声标准差 | *必填 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 局部连接层
#LocallyConnected1D层 (dl_layer_locallyconnected1d.v1)
LocallyConnected1D层与Conv1D工作方式类似,唯一的区别是不进行权值共享。即施加在不同输入位置的滤波器是不一样的。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
步长 | strides | str | 步长,strides,卷积的步长。整数列表,列表用英文逗号(,)分隔,例如 12,34 | 1 | |
padding | padding | choice | padding,补0策略 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#LocallyConnected2D层 (dl_layer_locallyconnected2d.v1)
LocallyConnected2D层与Convolution2D工作方式类似,唯一的区别是不进行权值共享。即施加在不同输入patch的滤波器是不一样的,当使用该层作为模型首层时,需要提供参数input_dim或input_shape参数。参数含义参考Convolution2D。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
步长 | strides | str | 步长,strides,卷积的步长。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | 1,1 | |
padding | padding | choice | padding,补0策略,为“valid”, “same” 。“valid”代表只进行有效的卷积,即对边界数据不处理。“same”代表保留边界处的卷积结果,通常会导致输出shape与输入shape相同。 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | None | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 嵌入层
#Embedding层 (dl_layer_embedding.v1)
嵌入层将正整数(下标)转换为具有固定大小的向量,如[[4],[20]]->[[0.25,0.1],[0.6,-0.2]]
Embedding层只能作为模型的第一层
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | input_dim | input_dim | int | input_dim,字典长度,即输入数据最大下标+1 | *必填 |
output_dim | output_dim | int | output_dim,全连接嵌入的维度 | *必填 | |
嵌入矩阵初始化 | embeddings_initializer | choice | 嵌入矩阵初始化,embeddings_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | uniform | |
自定义嵌入矩阵初始化 | user_embeddings_initializer | code | 自定义嵌入矩阵初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
嵌入矩阵正则项 | embeddings_regularizer | choice | 嵌入矩阵正则项,embeddings_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
嵌入矩阵正则项L1 | embeddings_regularizer_l1 | float | 嵌入矩阵正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
嵌入矩阵正则项L2 | embeddings_regularizer_l2 | float | 嵌入矩阵正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义嵌入矩阵正则项 | user_embeddings_regularizer | code | 自定义嵌入矩阵正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
嵌入矩阵约束项 | embeddings_constraint | choice | 嵌入矩阵约束项,embeddings_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义嵌入矩阵约束项 | user_embeddings_constraint | code | 自定义嵌入矩阵约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
mask_zero | mask_zero | bool | mask_zero,确定是否将输入中的‘0’看作是应该被忽略的‘填充’(padding)值,该参数在使用递归层处理变长输入时有用。设置为True的话,模型中后续的层必须都支持masking,否则会抛出异常。如果该值为True,则下标0在字典中不可用,input_dim应设置为|vocabulary| + 1 | False | |
input_length | input_length | int | input_length,当输入序列的长度固定时,该值为其长度。如果要在该层后接Flatten层,然后接Dense层,则必须指定该参数,否则Dense层的输出维度无法自动推断 | None | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 常用层
#激活层(Activation) (dl_layer_activation.v1)
激活层,对一个层的输出施加激活函数
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#ActivityRegularization层 (dl_layer_activityregularization.v1)
ActivityRegularizer层,经过本层的数据不会有任何变化,但会基于其激活值更新损失函数值,可设置L1/L2范数更新损失函数。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | L1范数 | l1 | float | L1范数,l1,L1范数正则因子(正浮点数) | 0.0 |
L2范数 | l2 | float | L2范数,l2,L2范数正则因子(正浮点数) | 0.0 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#全连接层(Dense) (dl_layer_dense.v1)
Dense,全连接层,所实现的运算是output = activation(dot(input, kernel)+bias)。其中activation是逐元素计算的激活函数,kernel是本层的权值矩阵,bias为偏置向量,只有当use_bias=True才会添加。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | Zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Dropout层 (dl_layer_dropout.v1)
为输入数据施加Dropout。Dropout将在训练过程中每次更新参数时按一定概率(rate)随机断开输入神经元,用于防止过拟合。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | rate | rate | float | rate,0~1的浮点数,控制需要断开的神经元的比例 | *必填 |
noise_shape | noise_shape | str | noise_shape,为将要应用在输入上的二值Dropout mask的shape,例如你的输入为(batch_size, timesteps, features),并且你希望在各个时间步上的Dropout mask都相同,则可传入noise_shape=(batch_size, 1, features) | None | |
随机数种子 | seed | int | 随机数种子 | None | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Flatten层 (dl_layer_flatten.v1)
Flatten层用来将输入“压平”,即把多维的输入一维化,常用在从卷积层到全连接层的过渡。Flatten不影响batch的大小。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#输入层(Input) (dl_layer_input.v1)
张量输入层
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | shape | shape | str | shape, 输入张量形状,用英文逗号(,)分隔的整数列表,例如 32,24,表示输入数据是一系列的 32x24的矩阵 | None |
batch_shape | batch_shape | str | batch_shape, A shape tuple (integer), including the batch size. For instance, | None | |
数据类型 | dtype | str | 数据类型, The data type expected by the input, as a string ( | float32 | |
sparse | sparse | bool | sparse, A boolean specifying whether the placeholder to be created is sparse. | False | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Lambda层 (dl_layer_lambda.v1)
Lambda层,实现将任意函数/表达式封装为Layer/层。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 函数 | function | code | 函数,求值函数,以输入张量作为参数 | 默认代码 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Masking层 (dl_layer_masking.v1)
屏蔽层。使用给定的值对输入的序列信号进行“屏蔽”,用以定位需要跳过的时间步。对于输入张量的时间步,即输入张量的第1维度(维度从0开始算,见例子),如果输入张量在该时间步上都等于mask_value,则该时间步将在模型接下来的所有层(只要支持masking)被跳过(屏蔽)。如果模型接下来的一些层不支持masking,却接受到masking过的数据,则抛出异常。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | mask_value | mask_value | float | mask_value | 0.0 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Permute层 (dl_layer_permute.v1)
Permute层将输入的维度按照给定模式进行重排,例如,当需要将RNN和CNN网络连接时,可能会用到该层。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | dims | dims | str | dims, 指定重排的模式,不包含样本数的维度。重拍模式的下标从1开始。例如 2,1 代表将输入的第二个维度重拍到输出的第一个维度,而将输入的第一个维度重排到第二个维度,用英文逗号(,)分隔的整数列表,例如 32,24 | *必填 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#RepeatVector层 (dl_layer_repeatvector.v1)
RepeatVector层将输入重复n次。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 重复次数 | n | int | 重复次数 | *必填 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Reshape层 (dl_layer_reshape.v1)
任意,但输入的shape必须固定。当使用该层为模型首层时,需要指定input_shape参数
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | target_shape | target_shape | str | target_shape, 目标shape,不包含样本数目的维度(batch大小),用英文逗号(,)分隔的整数列表,例如 32,24,表示输入数据是一系列的 32x24的矩阵 | *必填 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 循环层
#ConvLSTM2D层 (dl_layer_convlstm2d.v1)
ConvLSTM2D是一个LSTM网络,但它的输入变换和循环变换是通过卷积实现的
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 卷积核数目 | filters | int | 卷积核数目,filters,即输出的维度 | *必填 |
kernel_size | kernel_size | str | kernel_size,卷积核的空域或时域窗长度。整数列表,列表用英文逗号(,)分隔,例如 12,34 | *必填 | |
strides | strides | str | strides,卷积步长。当不等于1时,无法使用dilation功能,即dialation_rate必须为1。整数列表,列表用英文逗号(,)分隔,例如 12,34 | 1,1 | |
padding | padding | choice | padding,补0策略 | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
dilation_rate | dilation_rate | str | dilation_rate,指定dilated convolution中的膨胀比例。任何不为1的dilation_rate均与任何不为1的strides均不兼容。。整数列表,列表用英文逗号(,)分隔,例如 12,34 | 1,1 | |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
recurrent激活函数 | recurrent_activation | choice | recurrent激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用recurrent自定义激活函数 | hard_sigmoid | |
recurrent自定义激活函数 | user_recurrent_activation | code | recurrent自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
unit_forget_bias | unit_forget_bias | bool | unit_forget_bias,如果为, 初始化时在遗忘门的偏置项加1。设置为True,会强制使bias_initializer="Zeros" | True | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
return_sequences | return_sequences | bool | return_sequences,默认False,控制返回类型。若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
go_backwards | go_backwards | bool | go_backwards,默认为False,若为True,则逆向处理输入序列并返回逆序后的序列 | False | |
stateful | stateful | bool | stateful,默认为False,若为True,则一个batch中下标为i的样本的最终状态将会用作下一个batch同样下标的样本的初始状态 | False | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#CuDNNGRU层 (dl_layer_cudnngru.v1)
基于CuDNN的快速GRU实现,只能在GPU上运行,只能使用tensoflow为后端
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
return_sequences | return_sequences | bool | return_sequences,默认False,控制返回类型。若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
return_state | return_state | bool | return_state,是否在输出中返回最后状态 | False | |
stateful | stateful | bool | stateful,默认为False,若为True,则一个batch中下标为i的样本的最终状态将会用作下一个batch同样下标的样本的初始状态 | False | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#CuDNNLSTM层 (dl_layer_cudnnlstm.v1)
Fast LSTM implementation backed by CuDNN.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
unit_forget_bias | unit_forget_bias | bool | unit_forget_bias,如果为, 初始化时在遗忘门的偏置项加1。设置为True,会强制使bias_initializer="Zeros" | True | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
return_sequences | return_sequences | bool | return_sequences,默认False,控制返回类型。若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
return_state | return_state | bool | return_state,是否在输出中返回最后状态 | False | |
stateful | stateful | bool | stateful,默认为False,若为True,则一个batch中下标为i的样本的最终状态将会用作下一个batch同样下标的样本的初始状态 | False | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GRU层 (dl_layer_gru.v1)
门限循环单元。GRU(Gate Recurrent Unit)是循环神经网络(RNN)的一种。和LSTM一样,也是为了解决长期记忆和反向传播中的梯度等问题而提出来的,但是计算效率更高。
参考文献
- On the Properties of Neural Machine Translation: Encoder–Decoder Approaches
- Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling
- A Theoretically Grounded Application of Dropout in Recurrent Neural Networks
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
return_sequences | return_sequences | bool | return_sequences,默认False,控制返回类型。若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
go_backwards | go_backwards | bool | go_backwards,默认为False,若为True,则逆向处理输入序列并返回逆序后的序列 | False | |
stateful | stateful | bool | stateful,默认为False,若为True,则一个batch中下标为i的样本的最终状态将会用作下一个batch同样下标的样本的初始状态 | False | |
unroll | unroll | bool | unroll,若为True,则循环层将被展开,否则就使用符号化的循环。当使用TensorFlow为后端时,循环网络本来就是展开的,因此该层不做任何事情。层展开会占用更多的内存,但会加速RNN的运算。层展开只适用于短序列。 | False | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GRUCell层 (dl_layer_grucell.v1)
GRU的Cell类
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
recurrent激活函数 | recurrent_activation | choice | recurrent激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用recurrent自定义激活函数 | hard_sigmoid | |
recurrent自定义激活函数 | user_recurrent_activation | code | recurrent自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#LSTM层 (dl_layer_lstm.v1)
LSTM层,长短期记忆模型,RNN的一种,可以解决梯度爆炸的问题。关于此算法的详情,请参考 教程
- Long short-term memory (original 1997 paper)
- Learning to forget: Continual prediction with LSTM
- Supervised sequence labeling with recurrent neural networks
- A Theoretically Grounded Application of Dropout in Recurrent Neural Networks
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
recurrent激活函数 | recurrent_activation | choice | recurrent激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用recurrent自定义激活函数 | hard_sigmoid | |
recurrent自定义激活函数 | user_recurrent_activation | code | recurrent自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
是否使用偏置项 | use_bias | bool | 是否使用偏置项,use_bias | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | Orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | Zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
unit_forget_bias | unit_forget_bias | bool | unit_forget_bias,Boolean. If True, add 1 to the bias of the forget gate at initialization. Setting it to true will also force bias_initializer="Zeros". This is recommended in Jozefowicz et al. | True | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0 | |
返回整个输出序列 | return_sequences | bool | 返回整个输出序列,若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
层名 | name | str | 层名,名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#LSTMCell层 (dl_layer_lstmcell.v1)
LSTM的Cell类
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
recurrent激活函数 | recurrent_activation | choice | recurrent激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用recurrent自定义激活函数 | hard_sigmoid | |
recurrent自定义激活函数 | user_recurrent_activation | code | recurrent自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
unit_forget_bias | unit_forget_bias | bool | unit_forget_bias,如果为, 初始化时在遗忘门的偏置项加1。设置为True,会强制使bias_initializer="Zeros" | True | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#SimpleRNN层 (dl_layer_simplernn.v1)
全连接RNN网络,RNN的输出会被回馈到输入。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
return_sequences | return_sequences | bool | return_sequences,默认False,控制返回类型。若为True则返回整个序列,否则仅返回输出序列的最后一个输出 | False | |
return_state | return_state | bool | return_state,是否在输出中返回最后状态 | False | |
go_backwards | go_backwards | bool | go_backwards,默认为False,若为True,则逆向处理输入序列并返回逆序后的序列 | False | |
stateful | stateful | bool | stateful,默认为False,若为True,则一个batch中下标为i的样本的最终状态将会用作下一个batch同样下标的样本的初始状态 | False | |
unroll | unroll | bool | unroll,若为True,则循环层将被展开,否则就使用符号化的循环。当使用TensorFlow为后端时,循环网络本来就是展开的,因此该层不做任何事情。层展开会占用更多的内存,但会加速RNN的运算。层展开只适用于短序列。 | False | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#SimpleRNNCell层 (dl_layer_simplernncell.v1)
SinpleRNN的Cell类。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 输出空间维度 | units | int | 输出空间维度,units,正整数 | *必填 |
激活函数 | activation | choice | 激活函数,激活函数使用的是使用默认参数,如果需要修改参数,可以使用自定义激活函数 | tanh | |
自定义激活函数 | user_activation | code | 自定义激活函数,示例: def bigquant_run(x): import tensorflow as tf return tf.atan(x) | 默认代码 | |
use_bias | use_bias | bool | use_bias,是否使用偏置项 | True | |
权值初始化方法 | kernel_initializer | choice | 权值初始化方法,kernel_initializer,使用的是使用默认参数 | glorot_uniform | |
自定义权值初始化方法 | user_kernel_initializer | code | 自定义权值初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
循环核初始化方法 | recurrent_initializer | choice | 循环核初始化方法,recurrent_initializer,使用的是使用默认参数 | orthogonal | |
自定义循环核初始化方法 | user_recurrent_initializer | code | 自定义循环核初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
偏置向量初始化方法 | bias_initializer | choice | 偏置向量初始化方法,bias_initializer,使用的是使用默认参数 | zeros | |
自定义偏置向量初始化方法 | user_bias_initializer | code | 自定义偏置向量初始化方法,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
权值正则项 | kernel_regularizer | choice | 权值正则项,kernel_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
权值正则项L1 | kernel_regularizer_l1 | float | 权值正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
权值正则项L2 | kernel_regularizer_l2 | float | 权值正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义权值正则项 | user_kernel_regularizer | code | 自定义权值正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
循环核正则项 | recurrent_regularizer | choice | 循环核正则项,recurrent_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
循环核正则项L1 | recurrent_regularizer_l1 | float | 循环核正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
循环核正则项L2 | recurrent_regularizer_l2 | float | 循环核正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义循环核正则项 | user_recurrent_regularizer | code | 自定义循环核正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
偏置向量正则项 | bias_regularizer | choice | 偏置向量正则项,bias_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
偏置向量正则项L1 | bias_regularizer_l1 | float | 偏置向量正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
偏置向量正则项L2 | bias_regularizer_l2 | float | 偏置向量正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义偏置向量正则项 | user_bias_regularizer | code | 自定义偏置向量正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
输出正则项 | activity_regularizer | choice | 输出正则项,activity_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
输出正则项L1 | activity_regularizer_l1 | float | 输出正则项L1,如果使用L1L2正则化,此参数有效 | 0 | |
输出正则项L2 | activity_regularizer_l2 | float | 输出正则项L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义输出正则项 | user_activity_regularizer | code | 自定义输出正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
权值约束项 | kernel_constraint | choice | 权值约束项,kernel_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义权值约束项 | user_kernel_constraint | code | 自定义权值约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
循环核约束项 | recurrent_constraint | choice | 循环核约束项,recurrent_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义循环核约束项 | user_recurrent_constraint | code | 自定义循环核约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
偏置向量约束项 | bias_constraint | choice | 偏置向量约束项,bias_constraint,在优化过程中为网络的参数施加约束 | None | |
自定义偏置向量约束项 | user_bias_constraint | code | 自定义偏置向量约束项,示例: def bigquant_run(w): from keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
dropout | dropout | float | dropout,0~1之间的浮点数,控制输入线性变换的神经元断开比例 | 0.0 | |
recurrent_dropout | recurrent_dropout | float | recurrent_dropout,0~1之间的浮点数,控制循环状态的线性变换的神经元断开比例 | 0.0 | |
implementation | implementation | choice | implementation, 1或2,如果设为1,则RNN将以更多但更小的矩阵乘法实现,因此在CPU上运行更慢,在GPU上运行更快,并且消耗更少的内存。如果设为2,则RNN将以更少但是更大的矩阵乘法实现,因此在CPU上运行更快,但消耗更多的内存。 | 2 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#StackedRNNCells层 (dl_layer_stackedrnncells.v1)
这是一个wrapper,用于将多个recurrent cell包装起来,使其行为类型单个cell。该层用于实现高效的stacked RNN。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | RNN Cell | cell1 | 通用 | RNN Cell | *必填 |
RNN Cell | cell2 | 通用 | RNN Cell | None | |
RNN Cell | cell3 | 通用 | RNN Cell | None | |
RNN Cell | cell4 | 通用 | RNN Cell | None | |
输入 | inputs | 通用 | 输入 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
# 数据处理
#序列窗口滚动(深度学习) (dl_convert_to_bin.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | DataSource数据 | input_data | 通用 | DataSource数据 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
输入参数 | 窗口大小 | window_size | int | 窗口大小,滚动窗口大小,1为不滚动,只用当前一行特征 | 1 |
特征裁剪值 | feature_clip | int | 特征裁剪值 | 5 | |
是否特征展开 | flatten | bool | 是否特征展开,如果为True是(window_size*feature_size,),False是(window_wize,feature_size) | True | |
分组滚动窗口 | window_along_col | str | 分组滚动窗口,按window_along_col字段分组窗口滚动 | instrument | |
输出端 | 输出 | data | 通用 | 输出 |
# 池化层
#AveragePooling1D层 (dl_layer_averagepooling1d.v1)
对时域1D信号进行平均值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 池化的窗口大小 | pool_size | int | 池化的窗口大小,窗口大小,pool_size,整数,池化 | 2 |
下采样因子 | strides | int | 下采样因子,strides,整数或None,例如设2将会使得输出shape为输入的一半,若为None则默认值为pool_size | None | |
padding | padding | choice | padding | valid | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#AveragePooling2D层 (dl_layer_averagepooling2d.v1)
为空域信号施加平均值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | pool_size | pool_size | str | pool_size,代表在两个方向(竖直,水平)上的下采样因子,如取(2,2)将使图片在两个维度上均变为原长的一半。为整数意为各个维度值相同且为该数字。。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | 2,2 |
步长 | strides | str | 步长,strides,步长值,如果不设置,默认是pool_size。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | None | |
padding方式 | padding | choice | padding方式,padding,用于在卷积时保持边界信息。SAME方式,直接填充;VALID方式,直接计算输出 | valid | |
通道维位置 | data_format | choice | 通道维位置,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#AveragePooling3D层 (dl_layer_averagepooling3d.v1)
为3D信号(空域或时空域)施加平均值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | pool_size | pool_size | str | pool_size,代表在三个维度上的下采样因子,如取(2,2,2)将使信号在每个维度都变为原来的一半长。。长为 3 的整数列表,列表用英文逗号(,)分隔,例如 2,2,2 | 2,2,2 |
步长 | strides | str | 步长,strides,步长值,如果不设置,默认是pool_size。长为 3 的整数列表,列表用英文逗号(,)分隔,例如 2,2,2 | None | |
padding方式 | padding | choice | padding方式,padding,用于在卷积时保持边界信息。SAME方式,直接填充;VALID方式,直接计算输出 | valid | |
通道维位置 | data_format | choice | 通道维位置,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GlobalAveragePooling1D层 (dl_layer_globalaveragepooling1d.v1)
为时域信号施加全局平均值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#GlobalAveragePooling2D层 (dl_layer_globalaveragepooling2d.v1)
为空域信号施加全局最大值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#GlobalMaxPooling1D层 (dl_layer_globalmaxpooling1d.v1)
对于时间信号的全局最大池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#GlobalMaxPooling2D层 (dl_layer_globalmaxpooling2d.v1)
为空域信号施加全局最大值池化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#MaxPooling1D层 (dl_layer_maxpooling1d.v1)
对时域1D信号进行最大值池化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 窗口大小 | pool_size | int | 窗口大小,pool_size,整数,池化 | 2 |
下采样因子 | strides | int | 下采样因子,strides,整数或None,例如设2将会使得输出shape为输入的一半,若为None则默认值为pool_size | None | |
padding | padding | choice | padding | valid | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#MaxPooling2D层 (dl_layer_maxpooling2d.v1)
为空域信号施加最大值池化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | pool_size | pool_size | str | pool_size,代表在两个方向(竖直,水平)上的下采样因子,如取(2,2)将使图片在两个维度上均变为原长的一半。为整数意为各个维度值相同且为该数字。。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | 2,2 |
步长 | strides | str | 步长,strides,步长值,如果不设置,默认是pool_size。长为 2 的整数列表,列表用英文逗号(,)分隔,例如 2,2 | None | |
padding | padding | choice | padding | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#MaxPooling3D层 (dl_layer_maxpooling3d.v1)
为3D信号(空域或时空域)施加最大值池化。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | pool_size | pool_size | str | pool_size,代表在三个维度上的下采样因子,如取(2,2,2)将使信号在每个维度都变为原来的一半长。。长为 3 的整数列表,列表用英文逗号(,)分隔,例如 2,2,2 | 2,2,2 |
步长 | strides | str | 步长,strides,步长值,如果不设置,默认是pool_size。长为 3 的整数列表,列表用英文逗号(,)分隔,例如 2,2,2 | None | |
padding | padding | choice | padding | valid | |
通道维位置 | data_format | choice | 通道维位置,data_format,代表图像的通道维的位置,该参数是Keras 1.x中的image_dim_ordering,“channels_last”对应原本的“tf”,“channels_first”对应原本的“th”。以128x128的RGB图像为例,“channels_first”应将数据组织为(3,128,128),而“channels_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channels_last”。 | channels_last | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 融合层
#Add层 (dl_layer_add.v1)
属于融合层。属于融合层。该层接收一个列表的同shape张量,并返回它们的和,shape不变。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入3 | input3 | 通用 | 输入3 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#Average层 (dl_layer_average.v1)
属于融合层。属于融合层。该层接收一个列表的同shape张量,并返回它们的逐元素均值,shape不变。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入3 | input3 | 通用 | 输入3 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#Concatenate层 (dl_layer_concatenate.v1)
该层接收一个列表的同shape张量,并返回它们的按照给定轴相接构成的向量。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入3 | input3 | 通用 | 输入3 | None | |
输入参数 | axis | axis | int | axis,想接的轴 | -1 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Dot层 (dl_layer_dot.v1)
点积层,属于融合层。计算两个tensor中样本的张量乘积。例如,如果两个张量a和b的shape都为(batch_size, n),则输出为形如(batch_size,1)的张量,结果张量每个batch的数据都是a[i,:]和b[i,:]的矩阵(向量)点积。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入参数 | axes | axes | str | axes,执行乘法的轴,用英文逗号(,)分隔的整数列表,例如 32,24 | *必填 |
normalize | normalize | bool | normalize,是否沿执行成绩的轴做L2规范化,如果设为True,那么乘积的输出是两个样本的余弦相似性。 | False | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#Maximum层 (dl_layer_maximum.v1)
该层接收一个列表的同shape张量,并返回它们的逐元素最大值,shape不变。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入3 | input3 | 通用 | 输入3 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#Multiply层 (dl_layer_multiply.v1)
该层接收一个列表的同shape张量,并返回它们的逐元素积的张量,shape不变。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入3 | input3 | 通用 | 输入3 | None | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
#Subtract层 (dl_layer_subtract.v1)
该层接收两个同shape张量,并返回它们的逐元素差的张量,shape不变。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input1 | 通用 | 输入1 | *必填 |
输入2 | input2 | 通用 | 输入2 | *必填 | |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
# 规范层
#BatchNormalization层 (dl_layer_batchnormalization.v1)
该层在每个batch上将前一层的激活值重新规范化,使其输出数据的均值接近0,其标准差接近1。
BN层的作用:加速收敛;控制过拟合,可以少用或不用Dropout和正则;降低网络对初始化权重不敏感;允许使用较大的学习率。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 需要规范化的轴 | axis | int | 需要规范化的轴,axis,指定要规范化的轴,通常为特征轴。例如在进行data_format="channels_first的2D卷积后,一般会设axis=1 | -1 |
动量 | momentum | float | 动量,momentum,动态均值的动量 | 0.99 | |
epsilon | epsilon | float | epsilon,大于0的小浮点数,用于防止除0错误 | 0.001 | |
中心化 | center | bool | 中心化,center,若设为True,将会将beta作为偏置加上去,否则忽略参数beta | True | |
规范化 | scale | bool | 规范化,scale,若设为True,则会乘以gamma,否则不使用gamma。当下一层是线性的时,可以设False,因为scaling的操作将被下一层执行。 | True | |
beta初始化 | beta_initializer | choice | beta初始化,beta_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | zeros | |
自定义beta初始化 | user_beta_initializer | code | 自定义beta初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
gamma初始化 | gamma_initializer | choice | gamma初始化,gamma_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | ones | |
自定义gamma初始化 | user_gamma_initializer | code | 自定义gamma初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
moving_mean初始化 | moving_mean_initializer | choice | moving_mean初始化,moving_mean_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | zeros | |
自定义moving_mean初始化 | user_moving_mean_initializer | code | 自定义moving_mean初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
moving_variance初始化 | moving_variance_initializer | choice | moving_variance初始化,moving_variance_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | ones | |
自定义moving_variance初始化 | user_moving_variance_initializer | code | 自定义moving_variance初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
beta正则项 | beta_regularizer | choice | beta正则项,beta_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
beta正则项 L1 | beta_regularizer_l1 | float | beta正则项 L1,如果使用L1L2正则化,此参数有效 | 0 | |
beta正则项 L2 | beta_regularizer_l2 | float | beta正则项 L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义beta正则项 | user_beta_regularizer | code | 自定义beta正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
gamma正则项 | gamma_regularizer | choice | gamma正则项,gamma_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
gamma正则项 L1 | gamma_regularizer_l1 | float | gamma正则项 L1,如果使用L1L2正则化,此参数有效 | 0 | |
gamma正则项 L2 | gamma_regularizer_l2 | float | gamma正则项 L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义gamma正则项 | user_gamma_regularizer | code | 自定义gamma正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
beta约束项 | beta_constraint | choice | beta约束项,beta_constraint,在优化过程中为网络的参数施加约束。本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | None | |
自定义beta约束项 | user_beta_constraint | code | 自定义beta约束项,示例: def bigquant_run(w): from tensorflow.keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
gamma约束项 | gamma_constraint | choice | gamma约束项,gamma_constraint,在优化过程中为网络的参数施加约束。本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | None | |
自定义gamma约束项 | user_gamma_constraint | code | 自定义gamma约束项,示例: def bigquant_run(w): from tensorflow.keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#LayerNormalization层 (dl_layer_layernormalization.v1)
LayerNormalization是对输出归一化的,消除各层的covariate shift,加快收敛速度。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None |
输出端 | 输出 | data | 通用 | 输出 |
# 高级激活层
#ELU层 (dl_layer_elu.v1)
ELU层是指数线性单元(Exponential Linera Unit),表达式为: 该层为参数化的ReLU(Parametric ReLU),表达式是:f(x) = alpha * (exp(x) - 1.) for x < 0, f(x) = x for x>=0
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | alpha | alpha | float | alpha,scale for the negative factor,控制负因子的参数 | 1.0 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#LeakyReLU层 (dl_layer_leakyrelu.v1)
LeakyRelU是修正线性单元(Rectified Linear Unit,ReLU)的特殊版本,当不激活时,LeakyReLU仍然会有非零输出值,从而获得一个小梯度,避免ReLU可能出现的神经元“死亡”现象。即,f(x)=alpha * x for x < 0, f(x) = x for x>=0
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | alpha | alpha | float | alpha,Negative slope coefficient,代表激活函数图像中第三象限线段的斜率 | 0.3 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#PReLU层 (dl_layer_prelu.v1)
该层为参数化的ReLU(Parametric ReLU),表达式是:f(x) = alpha * x for x < 0, f(x) = x for x>=0,此处的alpha为一个与xshape相同的可学习的参数向量。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | alpha初始化 | alpha_initializer | choice | alpha初始化,alpha_initializer,本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | zeros |
自定义alpha初始化 | user_alpha_initializer | code | 自定义alpha初始化,示例: def bigquant_run(shape, dtype=None): import tensorflow.keras.backend as K return K.random_normal(shape, dtype=dtype) | 默认代码 | |
alpha正则项 | alpha_regularizer | choice | alpha正则项,alpha_regularizer,如果使用L1L2,可配置如下L1,L2参数 | None | |
alpha正则项 L1 | alpha_regularizer_l1 | float | alpha正则项 L1,如果使用L1L2正则化,此参数有效 | 0 | |
alpha正则项 L2 | alpha_regularizer_l2 | float | alpha正则项 L2,如果使用L1L2正则化,此参数有效 | 0 | |
自定义alpha正则项 | user_alpha_regularizer | code | 自定义alpha正则项,示例: def bigquant_run(weight_matrix): import tensorflow.keras.backend as K return 0.01 * K.sum(K.abs(weight_matrix)) | 默认代码 | |
alpha约束项 | alpha_constraint | choice | alpha约束项,alpha_constraint,在优化过程中为网络的参数施加约束。本选项里的函数使用的是默认参数,如果需要使用自定义参数或者其他函数,可以选择自定义,然后在下面输入自定义函数 | None | |
自定义alpha约束项 | user_alpha_constraint | code | 自定义alpha约束项,示例: def bigquant_run(w): from tensorflow.keras.constraints import max_norm return max_norm(2.)(w) | 默认代码 | |
共享轴 | shared_axes | str | 共享轴,shared_axes,该参数指定的轴将共享同一组科学系参数,例如假如输入特征图是从2D卷积过来的,具有形如(batch, height, width, channels)这样的shape,则或许你会希望在空域共享参数,这样每个filter就只有一组参数,设定shared_axes=[1,2]可完成该目标。整数列表,列表用英文逗号(,)分隔,例如 12,34 | None | |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
#ThresholdedReLU层 (dl_layer_thresholdedrelu.v1)
该层是带有门限的ReLU,表达式是:f(x) = x for x > theta,f(x) = 0 otherwise。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | theta | theta | float | theta,Threshold location of activation,激活门限位置 | 1.0 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 自定义层
#自定义层 (dl_layer_userlayer.v1)
对于简单的定制操作,我们或许可以通过使用layers.core.Lambda层来完成。但对于任何具有可训练权重的定制层,你应该自己来实现。
这里是一个层应该具有的框架结构,要定制自己的层,你需要实现下面三个方法:
- build(input_shape):这是定义权重的方法,可训练的权应该在这里被加入列表`self.trainable_weights中。其他的属性还包括self.non_trainabe_weights(列表)和self.updates(需要更新的形如(tensor, new_tensor)的tuple的列表)。你可以参考BatchNormalization层的实现来学习如何使用上面两个属性。这个方法必须设置self.built = True,可通过调用super([layer],self).build()实现
- call(x):这是定义层功能的方法,除非你希望你写的层支持masking,否则你只需要关心call的第一个参数:输入张量
- compute_output_shape(input_shape):如果你的层修改了输入数据的shape,你应该在这里指定shape变化的方法,这个函数使得Keras可以做自动shape推断
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入 | inputs | 通用 | 输入 | None |
输入参数 | 用户层定义 | layer_class | code | 用户层定义 | 默认代码 |
名字 | name | str | 名字, name, 可选,层的名字,在模型里不能有两个层同名。如果不指定,将自动分配名字 | None | |
输出端 | 输出 | data | 通用 | 输出 |
# 模型评估
#分类-评估 (metrics_classification.v1)
分类评估。输入模型结果,输出评估结果:精准率-召回率曲线、ROC-AUC、常用指标、准确率与错误率、混淆矩阵。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测结果 | predictions | 通用 | 预测结果,提供模型预测出的分类及分类对应概率 | *必填 |
输出端 | 评估报告 | data | 通用 | 评估报告 |
#回归-评估 (metrics_regression.v1)
回归评估。输入模型结果,输出对于回归的评估结果。具体评估标准包括R2,MSE,MAE等。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测结果 | predictions | 通用 | 预测结果,提供模型预测出的分类及分类对应概率 | None |
输入参数 | 可解释方差权重 | explained_variance_score | bool | 可解释方差权重, | True |
平均绝对误差 | mean_absolute_error | bool | 平均绝对误差 | True | |
均方误差权重 | mean_squared_error | bool | 均方误差权重 | True | |
均方对数误差权重 | mean_squared_log_error | bool | 均方对数误差权重 | True | |
均方绝对误差 | median_absolute_error | bool | 均方绝对误差 | True | |
确定系数(r^2)权重 | r2_score | bool | 确定系数(r^2)权重,列表类型 | True | |
输出端 | 评估报告 | report | 通用 | 评估报告 |
# 回测与交易
#极速回测(高频) (fastbacktest.v1)
快速回测引擎,支持高频数据快速回测。不支持模拟交易和实盘。
输入:
- input_data:输入数据,包含 date, price(价格), 和 position(仓位)
输出:
- data: DataSource,完整交易和绩效数据,可以使用 data.read_df() 读取和查看详细数据。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据 | input_data | 通用 | 数据,必须包含price和position字段 | None |
输入参数 | 报表数据显示频率 | report_freq | str | 报表数据显示频率,s=秒,h=小时,d=天,12h表示报表按12小时做resample。用越小的周期数据越多,可能无法完全显示 | 1h |
费率 | commission_rate | float | 费率:小于0.1时表示按金额比例收取,大于等于0.1时表示按手数收取 | 0.0001 | |
无风险利率 | risk_free_rate | float | 无风险利率 | 0.0 | |
显示回测结果图表 | plot_charts | bool | 显示回测结果图表 | True | |
轨迹图显示笔数 | tick_plot_num | int | 轨迹图显示笔数 | 20 | |
持仓动态图显示时间数 | time_tick_plot_num | int | 持仓动态图显示时间数 | 200 | |
输出端 | 回测详细数据 | data | 通用 | 回测详细数据 |
#多策略回测 (multi_strategy_analysis.v2)
多策略组合收益分析。思想是如果策略之间相关性不是很强,将多个策略的回测结果按策略各自分配的权重进行组合。组合的目的是为了平滑资金曲线。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 策略收益原始数据第1个 (一般自来于 | raw_perf_1 | 通用 | 策略收益原始数据第1个 (一般自来于 :doc: | None |
策略收益原始数据第2个 (一般自来于 | raw_perf_2 | 通用 | 策略收益原始数据第2个 (一般自来于 :doc: | None | |
策略收益原始数据第3个 (一般自来于 | raw_perf_3 | 通用 | 策略收益原始数据第3个 (一般自来于 :doc: | None | |
输入参数 | 策略收益原始数据列表 (一般自来于 | raw_perfs | code | 策略收益原始数据列表 (一般自来于 :doc: | 默认代码 |
每个回测结果的权重 | weights | str | 每个回测结果的权重 | ||
再平衡周期 | rebalance_period | int | 再平衡周期 | 0 | |
开始日期 | start_date | str | 开始日期,默认是raw_perfs里的最小日期 | None | |
结束日期 | end_date | str | 结束日期,默认是raw_perfs里的最大日期 | None | |
基准指数 | benchmark | str | 基准指数 | 000300.SHA | |
回调函数 | prepare | code | 回调函数,准备数据 | 默认代码 | |
回调函数 | initialize | code | 回调函数,初始化函数 | 默认代码 | |
回调函数 | before_trading_start | code | 回调函数 ,策略交易单位周期开始前执行, I.code_python | 默认代码 | |
初始资金 | capital_base | float | 初始资金 | 1000000.0 | |
自动取消无法成交订单 | auto_cancel_non_tradable_orders | bool | 自动取消无法成交订单:是否自动取消因为停牌等原因不能成交的订单 | True | |
回测数据频率 | data_frequency | choice | 回测数据频率:日线 (daily),分钟线 (minute) | daily | |
回测价格类型 | price_type | choice | 回测价格类型:真实价格(original),后复权(backward_adjusted) | 后复权 | |
回测产品类型 | product_type | choice | 回测产品类型:股票(stock), 期货(future) | 股票 | |
显示回测结果图表 | plot_charts | bool | 显示回测结果图表 | True | |
成交率限制 | volume_limit | float | 成交率限制:执行下单时控制成交量参数,默认值2.5%,若设置为0时,不进行成交量检查 | 0.025 | |
买入点 | order_price_field_buy | choice | 买入点:open=开盘买入,close=收盘买入 | open | |
卖出点 | order_price_field_sell | choice | 卖出点:open=开盘卖出,close=收盘卖出 | close | |
回调函数 | handle_data | code | 回调函数,策略主体逻辑函数 | 默认代码 | |
用户自定义数据 | options | code | 用户自定义数据,在回调函数中要用到的变量,需要从这里传入,并通过 context.options 使用 | 默认代码 | |
输出端 | 回测结果原始数据 | raw_perf | 通用 | 回测结果原始数据 |
#Trade (回测/模拟) (trade.v4)
量化交易引擎。支持回测和模拟实盘交易
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表,如果提供了 | None |
其他输入数据 | options_data | 通用 | 其他输入数据:回测中用到的其他数据,比如预测数据、训练模型等。如果设定,在回测中通过 context.options['data'] 使用 | None | |
回测历史数据 | history_ds | 通用 | 回测历史数据 | None | |
基准数据 | benchmark_ds | 通用 | 基准数据,不影响回测结果 | None | |
交易日历 | trading_calendar | 通用 | 交易日历 | None | |
输入参数 | 开始日期 | start_date | str | 开始日期,设定值只在回测模式有效,在模拟实盘模式下为当前日期,示例:2017-06-01。一般不需要指定,使用 代码列表 里的开始日期 | |
结束日期 | end_date | str | 结束日期,设定值只在回测模式有效,在模拟实盘模式下为当前日期,示例:2017-06-01。一般不需要指定,使用 代码列表 里的结束日期 | ||
初始化函数 | initialize | code | 初始化函数,[回调函数] 初始化函数,整个回测中只在最开始时调用一次,用于初始化一些账户状态信息和策略基本参数,context也可以理解为一个全局变量,在回测中存放当前账户信息和策略基本参数便于会话。 | 默认代码 | |
主函数 | handle_data | code | 主函数,[回调函数] 必须实现的函数,该函数每个单位时间会调用一次, 如果按天回测,则每天调用一次,如果按分钟,则每分钟调用一次,由于我们现在数据只有日K,所以是按天回调。在回测中,可以通过对象data获取单只股票或多只股票的时间窗口价格数据。如果算法中没有schedule_function函数,那么该函数为必选函数。一般策略的交易逻辑和订单生成体现在该函数中。 | 默认代码 | |
数据准备函数 | prepare | code | 数据准备函数,[回调函数] 准备数据函数,运行过程中只调用一次,在 initialize 前调用,准备交易中需要用到数据。目前支持设置交易中用到的股票列表,设置到 context.instruments。更多 | 默认代码 | |
盘前处理函数 | before_trading_start | code | 盘前处理函数,[回调函数] 每个单位时间开始前调用一次,即每日开盘前调用一次,该函数是可选函数。你的算法可以在该函数中进行一些数据处理计算,比如确定当天有交易信号的股票池。 | 默认代码 | |
成交率限制 | volume_limit | float | 成交率限制:执行下单时控制成交量参数,默认值2.5%,若设置为0时,不进行成交量检查 | 0.025 | |
买入点 | order_price_field_buy | choice | 买入点:open=开盘买入,close=收盘买入 | open | |
卖出点 | order_price_field_sell | choice | 卖出点:open=开盘卖出,close=收盘卖出 | close | |
初始资金 | capital_base | float | 初始资金 | 1000000.0 | |
自动取消无法成交订单 | auto_cancel_non_tradable_orders | bool | 自动取消无法成交订单:是否自动取消因为停牌等原因不能成交的订单 | True | |
回测数据频率 | data_frequency | choice | 回测数据频率:日线 (daily),分钟线 (minute) | daily | |
回测价格类型 | price_type | choice | 回测价格类型:前复权(forward_adjusted),真实价格(original),后复权(backward_adjusted) | 真实价格 | |
回测产品类型 | product_type | choice | 回测产品类型:股票(stock), 期货(future), 期权(option), 数字货币(dcc) | 股票 | |
显示回测结果图表 | plot_charts | bool | 显示回测结果图表 | True | |
只在回测模式下运行 | backtest_only | bool | 只在回测模式下运行:默认情况下,Trade会在回测和实盘模拟模式下都运行。如果策略中有多个M.trade,在实盘模拟模式下,只能有一个设置为运行,其他的需要设置为 backtest_only=True,否则将会有未定义的行为错误 | False | |
用户自定义数据 | options | doc | 用户自定义数据,在回调函数中要用到的变量,需要从这里传入,并通过 context.options 使用 | None | |
基准代码 | benchmark | str | 基准代码,不影响回测结果 | ||
输出端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 |
#TradeX(模块化回测交易) (tradex.v1)
支持函数模块化的量化交易引擎。无缝支持回测和模拟实盘交易
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | instruments | 通用 | 代码列表,如果提供了 | None |
回测历史数据 | history_ds | 通用 | 回测历史数据,如果不指定,将根据instruments从系统中读取 | None | |
基准数据 | benchmark | 通用 | 基准数据,如果不指定,将使用默认的基准数据。 | None | |
交易日历 | trading_calendar | 通用 | 交易日历,如果不指定,将使用默认交易日历 | None | |
initialize处理函数 | initialize_functions | 通用 | initialize处理函数 | None | |
handle_bar处理函数 | handle_bar_functions | 通用 | handle_bar处理函数 | None | |
输入数据 | options_data | 通用 | 输入数据:一般用来传入策略中要用到的数据。我们建议策略用到的数据在外面批量计算完成,并通过此参数传入使用,例如模型预测数据等。如果设定,在回测中通过 context.options['data'] 使用 | None | |
输入参数 | 开始日期 | start_date | str | 开始日期,设定值只在回测模式有效,在模拟实盘模式下为当前日期,示例:2017-06-01。一般不需要指定,使用 证券代码列表 里的开始日期 | |
结束日期 | end_date | str | 结束日期,设定值只在回测模式有效,在模拟实盘模式下为当前日期,示例:2017-06-01。一般不需要指定,使用 证券代码列表 里的结束日期 | ||
主函数 | handle_data | code | 主函数,[回调函数] 必须实现的函数,该函数每个单位时间会调用一次, 如果按天回测,则每天调用一次,如果按分钟,则每分钟调用一次,由于我们现在数据只有日K,所以是按天回调。在回测中,可以通过对象data获取单只股票或多只股票的时间窗口价格数据。如果算法中没有schedule_function函数,那么该函数为必选函数。一般策略的交易逻辑和订单生成体现在该函数中。 | 默认代码 | |
数据准备函数 | prepare | code | 数据准备函数,[回调函数] 准备数据函数,运行过程中只调用一次,在 initialize 前调用,准备交易中需要用到数据。目前支持设置交易中用到的股票列表,设置到 context.instruments。更多 | 默认代码 | |
初始化函数 | initialize | code | 初始化函数,[回调函数] 初始化函数,整个回测中只在最开始时调用一次,用于初始化一些账户状态信息和策略基本参数,context也可以理解为一个全局变量,在回测中存放当前账户信息和策略基本参数便于会话。 | 默认代码 | |
盘前处理函数 | before_trading_start | code | 盘前处理函数,[回调函数] 每个单位时间开始前调用一次,即每日开盘前调用一次,该函数是可选函数。你的算法可以在该函数中进行一些数据处理计算,比如确定当天有交易信号的股票池。 | 默认代码 | |
成交率限制 | volume_limit | float | 成交率限制:执行下单时控制成交量参数,默认值2.5% | 0.025 | |
买入点 | order_price_field_buy | choice | 买入点:open=开盘买入,close=收盘买入 | open | |
卖出点 | order_price_field_sell | choice | 卖出点:open=开盘卖出,close=收盘卖出 | close | |
初始资金 | capital_base | float | 初始资金 | 1000000.0 | |
自动取消无法成交订单 | auto_cancel_non_tradable_orders | bool | 自动取消无法成交订单:是否自动取消因为停牌等原因不能成交的订单 | True | |
回测数据频率 | data_frequency | choice | 回测数据频率:日线 (daily),分钟线 (minute) | daily | |
回测价格类型 | price_type | choice | 回测价格类型:前复权(forward_adjusted),真实价格(original),后复权(backward_adjusted) | 真实价格 | |
回测产品类型 | product_type | choice | 回测产品类型:股票(stock), 期货(future), 期权(option), 数字货币(dcc) | 股票 | |
显示回测结果图表 | plot_charts | bool | 显示回测结果图表 | True | |
只在回测模式下运行 | backtest_only | bool | 只在回测模式下运行:默认情况下,Trade会在回测和实盘模拟模式下都运行。如果策略中有多个M.trade,在实盘模拟模式下,只能有一个设置为运行,其他的需要设置为 backtest_only=True,否则将会有未定义的行为错误 | False | |
用户自定义数据 | options | doc | 用户自定义数据,在回调函数中要用到的变量,需要从这里传入,并通过 context.options 使用 | None | |
输出端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 |
# 初始化函数
#设置手续费 (trade_func_set_commission.v1)
设置手续会,如果不设置,则使用默认的
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 收费模式 | mode | choice | 收费模式 | 订单/PerOrder |
买入成本 | buy_cost | float | 买入成本,成交额的比例,PerOrder/PerTrade/PerShare都要使用此参数 | 0.0003 | |
卖出成本 | sell_cost | float | 卖出成本,成交额的比例 | 0.0013 | |
最小成本 | min_cost | float | 最小成本,绝对值 | 5 | |
输出端 | 函数 | functions | 通用 | 函数 |
#设置最大杠杆限制 (trade_func_set_max_leverage.v1)
设置资金使用的最大杠杠限制,e.g. 设置最大杠杆限制为2,实际资金是100w,将可以买入200w的股票。一般用于期货或者股票+对冲等策略。需注意正确使用
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 最大杠杆限制 | max_leverage | float | 最大杠杆限制,e.g. 设置最大杠杆限制为2,实际资金是100w,将可以买入200w的股票。一般用于期货或者股票+对冲等策略。需注意正确使用 | 1 |
输出端 | 函数 | functions | 通用 | 函数 |
# 交易函数
#按排序买入 (trade_func_buy_by_rank.v1)
根据排序买入。排序数据从 context.options['data'] 读取。
总买入资金由 context.curr_data['buy_target_percent'] 确定:None表示跳过,cash
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 权重模式 | mode | choice | 权重模式,等权重:等权重购买;对数权重:1/log2(position+bias);倒数权重:1/(position+bias) | 对数权重 |
bias | bias | float | bias,权重参数 bias | 2 | |
股票数量 | stock_count | int | 股票数量,买入股票数量 | 5 | |
单位对齐 | unit | int | 单位对齐,例如100表示整百股(A股的1手)下单,0表示不限制 | 0 | |
每只股票最大仓位 | max_position_per_instrument | float | 每只股票最大仓位 | 0.1 | |
输出端 | 函数 | functions | 通用 | 函数 |
#在第一天买入 (trade_func_buy_on_first_trading_day.v1)
只在第一天买入指定的股票
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 买入证券代码 | instruments | str | 买入证券代码,多个代码用英文逗号分隔 | *必填 |
仓位比例 | positions | str | 仓位比例,多个比例用英文逗号分隔,其和不能超过1 | 1 | |
输出端 | 函数 | functions | 通用 | 函数 |
#自定义买入 (trade_func_customized_buy.v1)
用户自定义买入函数
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
input_1 | input_1 | 通用 | input_1 | None | |
input_2 | input_2 | 通用 | input_2 | None | |
输入参数 | 买入函数 | func | code | 买入函数 | 默认代码 |
param_1 | param_1 | str | param_1 | ||
param_2 | param_2 | str | param_2 | ||
param_3 | param_3 | str | param_3 | ||
输出端 | 函数 | functions | 通用 | 函数 |
#自定义卖出 (trade_func_customized_sell.v1)
用户自定义卖出函数
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
input_1 | input_1 | 通用 | input_1 | None | |
input_2 | input_2 | 通用 | input_2 | None | |
输入参数 | 卖出函数 | func | code | 卖出函数 | 默认代码 |
param_1 | param_1 | str | param_1 | ||
param_2 | param_2 | str | param_2 | ||
param_3 | param_3 | str | param_3 | ||
输出端 | 函数 | functions | 通用 | 函数 |
#平衡对冲仓位 (trade_func_rebalance_hedge.v1)
根据给定的证券代码,对冲其他证券持仓
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 用于对冲的证券代码 | instruments | str | 用于对冲的证券代码,多个代码用英文逗号分隔 | *必填 |
仓位比例 | positions | str | 仓位比例,相对于多头持仓价值,多个比例用英文逗号分隔 | 1 | |
输出端 | 函数 | functions | 通用 | 函数 |
#调仓管理 (trade_func_rebalance_manage.v1)
调仓周期。
输出:context.curr_data['buy_target_percent']和context.curr_data['sell_target_percent']
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 模式 | mode | choice | 模式,滚动:每天调仓,在给定周期轮完成一轮;固定:每给定周期的一天完成调仓 | 滚动 |
周期 | period | int | 周期,调仓周期 | 5 | |
输出端 | 函数 | functions | 通用 | 函数 |
#卖出全部持仓 (trade_func_sell_all_positions.v1)
每次调仓,平掉当前已有持仓。此模块会忽略 context.curr_data['sell_target_percent']。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输出端 | 函数 | functions | 通用 | 函数 |
#按持仓时间卖出 (trade_func_sell_by_hold_days.v1)
每次调仓,卖出持有时间超过指定日期的证券。一般用于固定时间持仓策略。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输入参数 | 持仓时间 | hold_days | int | 持仓时间,卖出持有超过此天数(>=)的证券,0表示使用调仓周期 | 0 |
输出端 | 函数 | functions | 通用 | 函数 |
#按排序卖出 (trade_func_sell_by_rank.v1)
根据排序卖出。排序数据从 context.options['data'] 读取。
总买入资金由 context.curr_data['sell_target_percent'] 确定:None表示跳过,cash
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 前置处理函数 | input_functions | 通用 | 前置处理函数 | None |
输出端 | 函数 | functions | 通用 | 函数 |
# 量化分析
#Brinson绩效归因 (Brinson.v7)
Brinson绩效归因,用于回测结果分析。将投资组合的收益分解到择时timing、选股selection、其他other、超额excess四个维度。模块返回区间收益归因图。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | backtest_ds | 通用 | 回测详细数据 | None |
输入参数 | 策略基准 | benchmark | str | 策略基准, 默认为沪深300 | 000300.HIX |
输出端 | 绩效归因 | perf_attribution | 通用 | 绩效归因 |
#最近N日绩效评估 (N_days_performance_statistics.v5)
根据策略回测曲线,统计近期绩效指标。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | backtest_ds | 通用 | 回测详细数据 | None |
输入参数 | N日绩效指标评估 | N | int | N日绩效指标评估,默认为5 | 5 |
输出端 | N日绩效指标 | evaluation_of_perf_indicator | 通用 | N日绩效指标 | |
N日阶段收益率分析 | analysis_of_stage_return_rat | 通用 | N日阶段收益率分析 |
#经典组合优化器 (classical_portfolio_optimizer.v6)
投资组合管理者在设定了投资收益预期、风险预算、相关约束和风险模型之后, 依托优化器的快速计算优势,得到资产配置最优化结果。优化器模块可以基于选定的目标函数,输出优化后的投资权重调整建议。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入用于优化的股票代码列表 | input_1 | 通用 | 输入用于优化的股票代码列表,dict格式,具体样例 | None |
输入参数 | 股票代码列表(可选) | symbols | code | 股票代码列表(可选),单独使用该模块时(即无输入)用于优化的股票代码列表 | 默认代码 |
开始日期 | date | str | 开始日期,只在无输入时使用 | 2018-01-01 | |
权重之和 | weight_sum | float | 权重之和 | 1 | |
权重上限 | upper_weight | float | 权重上限 | 0.3 | |
权重下限 | lower_weight | float | 权重下限 | 0.01 | |
优化时间段 | before_start_days | int | 优化时间段,数据向前取的天数 | 252 | |
优化目标 | target | choice | 优化目标,组合目标 | 风险平价 | |
若优化失败 | return_equal_weight_if_fail | bool | 若优化失败,返回等权重结果,如果失败是否返回等权重结果 | True | |
输出端 | 经典组合优化器输出结果 | data_1 | 通用 | 经典组合优化器输出结果 |
#每日持仓分析 (daily_position_analysis.v6)
用于回测结果分析。分析每日持仓股票的行业分布和数量分布。输出持仓行业市值和top10持仓的股票。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | backtest_ds | 通用 | 回测详细数据 | None |
输出端 | 每日各行业市值(申万一级) | industry_market_value_daily | 通用 | 每日各行业市值(申万一级) | |
每日的top10持仓 | top10_positions | 通用 | 每日的top10持仓 |
#单因子分析 (single_factor_analysis.v4)
单因子分析,单独使用。输出因子暴露月分布图、因子暴露时序分析、因子相关性分析、因子行业分布、因子IC分析、因子分组收益、多空组合收益、因子收益t检验等。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 因子名 | factor | str | 因子名 | market_cap_0 |
开始日期 | start_date | str | 开始日期 | 2018-01-01 | |
结束日期 | end_date | str | 结束日期 | 2018-10-31 | |
输出端 | 单因子分析结果 | data | 通用 | 单因子分析结果 |
#策略容量分析 (strategy_capacity_analyzer.v1)
对传入的回测详细数据,进行策略容量分析计算并对计算结果进行可视化
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输入参数 | 成交比率 | volume_limit | float | 成交比率 | 0.025 |
策略容量计算方式(开盘N分钟) | frequency | choice | 策略容量计算方式(开盘N分钟) | 15m | |
策略容量计算函数 | calculate | code | 策略容量计算函数 | 默认代码 |
#因子收益及风险分析 (strategy_ret_risk_analysis.v1)
因子收益及风险分析.
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | backtest_ds | 通用 | 回测详细数据 | None |
输入参数 | 基准代码 | benchmark_symbol | choice | 基准代码 | 000300.HIX |
因子数据窗口值 | feature_window | int | 因子数据窗口值 | 60 | |
输出端 | 因子收益及风险分析分析结果 | data | 通用 | 因子收益及风险分析分析结果 |
# 高级优化
#超参搜索 (hyper_parameter_search.v1)
设置超参数范围和评分函数,自动进行网格搜索。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | graph | bq_graph_port | 通用 | graph,可以重写全局传入的graph | None |
输入1 | input_1 | 通用 | 输入1,run函数参数inputs的第1个元素 | None | |
输入2 | input_2 | 通用 | 输入2,run函数参数inputs的第2个元素 | None | |
输入3 | input_3 | 通用 | 输入3,run函数参数inputs的第3个元素 | None | |
输入参数 | 超参数输入 | param_grid_builder | code | 超参数输入,构建需要搜索的超参数列表 | 默认代码 |
评分函数 | scoring | code | 评分函数 | 默认代码 | |
参数搜索算法 | search_algorithm | choice | 参数搜索算法 | 网格搜索 | |
搜索迭代次数 | search_iterations | int | 搜索迭代次数,用于随机搜索 | 10 | |
随机数种子 | random_state | int | 随机数种子,用于随机搜索,不填则默认使用np.random | None | |
并行运行作业数 | workers | int | 并行运行作业数,会员可以使用更多的并行作业,请联系微信客服 bigq100 开通 | 1 | |
作业分布式运行 | worker_distributed_run | bool | 作业分布式运行,在集群里分布式运行参数搜索作业 | True | |
不显示作业日志 | worker_silent | bool | 不显示作业日志,如果作业日志太多,可以选择不显示 | True | |
即时执行 | run_now | bool | 即时执行,如果不勾选,此模块不会即时执行,而是将当前行为打包为graph传入到后续模块执行 | True | |
bq_graph | bq_graph | bool | bq_graph,用于接收全局传入的graph,用户设置值无效 | True | |
输出端 | 结果 | result | 通用 | 结果 |
#滚动训练 (hyper_rolling_train.v1)
滚动训练模块可以实现训练集和测试集的定期更新轮换。在金融市场中,市场结构是时常变化的,因此模型需要不断训练,这也是滚动训练的出发点。一般而言,是随着时间的推移按固定的时间定期训练模型,比如训练集为2年时间,预测集为1年,模型更新时间为1年。那么由2010-2011年的数据训练出的模型在2012年数据上预测,由2011-2012年训练的模型在2013年数据上预测,依次类推,最后把每次预测的数据拼接起来,进行回测验证。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | graph | bq_graph_port | 通用 | graph,可以重写全局传入的graph | None |
输入1 | input_1 | 通用 | 输入1,run函数参数inputs的第1个元素 | None | |
输入1 | input_2 | 通用 | 输入1,run函数参数inputs的第2个元素 | None | |
输入1 | input_3 | 通用 | 输入1,run函数参数inputs的第3个元素 | None | |
输入参数 | run函数 | run | code | run函数 | 默认代码 |
即时执行 | run_now | bool | 即时执行,如果不勾选,此模块不会即时执行,并将当前行为打包为graph传入到后续模块执行 | True | |
bq_graph | bq_graph | bool | bq_graph,用于接收全局传入的graph,用户设置值无效 | True | |
输出端 | 结果 | result | 通用 | 结果 |
#自定义运行 (hyper_run.v1)
自定义运行,可以在这里批量设置参数,批量运行,比如对某因子池进行单个因子验证,比如对训练模块学习率在某个范围按一定步长单个测试验证。该模块也可结合超参数调优、滚动训练等场景使用。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | graph | bq_graph_port | 通用 | graph,可以重写全局传入的graph | None |
输入1 | input_1 | 通用 | 输入1,run函数参数inputs的第1个元素 | None | |
输入2 | input_2 | 通用 | 输入2,run函数参数inputs的第2个元素 | None | |
输入3 | input_3 | 通用 | 输入3,run函数参数inputs的第3个元素 | None | |
输入参数 | run函数 | run | code | run函数 | 默认代码 |
即时执行 | run_now | bool | 即时执行,如果不勾选,此模块不会即时执行,并将当前行为打包为graph传入到后续模块执行 | True | |
bq_graph | bq_graph | bool | bq_graph,用于接收全局传入的graph,用户设置值无效 | True | |
输出端 | 结果 | result | 通用 | 结果 |
# 自定义模块
#自定义Python模块 (cached.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入1 | input_1 | 通用 | 输入1,传入到函数的参数 input_1 | None |
输入2 | input_2 | 通用 | 输入2,传入到函数的参数 input_2 | None | |
输入3 | input_3 | 通用 | 输入3,传入到函数的参数 input_3 | None | |
输入参数 | 主函数 | run | code | 主函数,返回Outputs对象 | 默认代码 |
后处理函数 | post_run | code | 后处理函数,输入是主函数的输出,此函数输出不会被缓存 | 默认代码 | |
模块输入端 | input_ports | str | 模块输入端,另存为模块时使用,示例input1,input2... | ||
模块参数 | params | code | 模块参数,字典形式,给出参数的值。比如{'param1':1,'param2':2} | 默认代码 | |
模块输出端 | output_ports | str | 模块输出端,另存为模块时使用,示例data1,data2... | ||
主函数参数 | kwargs | doc | 主函数参数,run的参数,如果函数接受参数 input_1/2/3,如上的 input_1/2/3也将被加入到此参数里。在可视化模式下,只有参数 input_1/2/3 可用。 | None | |
输出端 | 输出1 | data_1 | 通用 | 输出1,对应函数输出的 data_1 | |
输出2 | data_2 | 通用 | 输出2,对应函数输出的 data_2 | ||
输出3 | data_3 | 通用 | 输出3,对应函数输出的 data_3 |
# 数据导入与构建
#修改表信息 (datahub_alter_table.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 表名 | alias | str | 表名 | *必填 |
测试 | test | bool | 测试, 查看更新前后数据对比, 不更新表信息 | True | |
新schema | update_schema | code | 新schema,写入您定义的新的schema | 默认代码 | |
输出端 | 更新结果 | None | 通用 | 更新结果 |
#创建定时任务 (datahub_bash_operator.v3)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 任务名(默认) | task_name | choice | 任务名(默认) | 当前文件名 |
定时设置 | schedule_interval | str | 定时设置,可参考linux cron语法或者使用 @daily / @once / @hourly / @weekly / @monthly / @yearly, 建议定时设置最小间隔为15分钟 | 0 8 * * * | |
即时执行 | run_now | bool | 即时执行, 如果不勾选, 此模块不会即时执行 | True | |
输出端 | 任务 | task | 通用 | 任务 |
#删除用户数据表 (datahub_delete_table.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 表名 | alias | str | 表名, 删除的表名称, 用户表明后缀为_U | *必填 |
输出端 | msg | None | 通用 | msg |
#数据处理(自定义) (datahub_handler_column.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据, 数据DataFrame | *必填 |
输入参数 | 自定义处理函数 | handler | code | 自定义处理函数, 自定义函数, 处理数据 | 默认代码 |
输出端 | 数据 | data | 通用 | 数据 |
#创建定时任务(自定义) (datahub_kube_operator.v2)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 即时执行 | run_now | bool | 即时执行, 如果不勾选, 此模块不会即时执行 | True |
定时设置 | schedule_interval | str | 定时设置,可参考linux cron语法或者使用 @daily / @once / @hourly / @weekly / @monthly / @yearly | 15 5 * * * | |
任务名 | task_name | choice | 任务名, 默认为当前文件目录 + 当前文件名的形式生成 | 当前文件名 | |
通知邮箱 | str | 通知邮箱, 多个可以使用 "," 分隔, 任务失败发送邮件提醒 | |||
重试次数 | retry_times | str | 重试次数 | 3 | |
镜像 | image | str | 镜像, 默认用户userbox镜像,使用其他镜像在此填入镜像地址 | default | |
节点选择 | node_selectors | code | 节点选择 | 默认代码 | |
挂载目录 | volume_mounts | code | 挂载目录 | 默认代码 | |
环境变量 | env_vars | code | 环境变量 | 默认代码 | |
输出端 | 任务 | task | 通用 | 任务 |
#可读用户数据表 (datahub_list_tables.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 包含公开数据表 | contain_public | bool | 包含公开数据表, 包含公开数据表将会把公开的数据表一起查询出来 | True |
输出端 | tables | None | 通用 | tables |
#读取数据(DataSource) (datahub_load_datasource.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 表名 | table | str | 表名, 线上数据表名 | *必填 |
开始时间 | start_date | str | 开始时间 | ||
结束时间 | end_date | str | 结束时间 | ||
股票列表 | instruments | code | 股票列表 | 默认代码 | |
字段列表 | fields | code | 字段列表 | 默认代码 | |
输出端 | 数据(DataFrame) | data | 通用 | 数据(DataFrame) |
#读取数据(MySql) (datahub_load_db.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 数据库连接 | conn | str | 数据库连接,数据库连接字符串,username:password@host:port | *必填 |
数据库名称 | database | str | 数据库名称 | *必填 | |
查询SQL | generate_sql | code | 查询SQL, 编写自定义sql读取数据库中的数据 | 默认代码 | |
charset | charset | str | charset,字符集 | utf8 | |
输出端 | 数据 | data | 通用 | 数据 |
#读取数据(文件) (datahub_load_file.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 文件路径生成函数 | file_path | code | 文件路径生成函数, 自定义函数, 处理数据 | 默认代码 |
文件类型 | file_type | choice | 文件类型 | csv | |
csv文件分隔符 | csv_delimiter | str | csv文件分隔符, 默认是都好, h5文件不需要填入此值 | , | |
H5文件key | h5_data_key | str | H5文件key, 默认是data, csv文件不需要填入此值 | data | |
输出端 | 数据 | data | 通用 | 数据 |
#读取数据(MongoDB) (datahub_load_mongo.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 数据库连接 | conn | str | 数据库连接, 数据库连接字符串,username:password@host:port | *必填 |
数据库名称 | database | str | 数据库名称 | *必填 | |
数据集合 | table | str | 数据集合, 可选, 建议使用sql的方式动态查询每次构建的数据,确保每次数据都是最新的 | *必填 | |
查询条件 | generate_condition | code | 查询条件, 编写自定义sql读取数据库中的数据 | 默认代码 | |
输出端 | 数据 | data | 通用 | 数据 |
#读取数据(Oracle) (datahub_load_oracle.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 数据库连接 | conn | str | 数据库连接, 数据库连接字符串,username:password@host:port | *必填 |
数据库名称 | database | str | 数据库名称 | *必填 | |
查询SQL | generate_sql | code | 查询SQL, 编写自定义sql读取数据库中的数据 | 默认代码 | |
输出端 | 数据 | data | 通用 | 数据 |
#读取数据(Postgres) (datahub_load_postgres.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 数据库连接 | conn | str | 数据库连接, 数据库连接字符串,username:password@host:port | *必填 |
数据库名称 | database | str | 数据库名称 | *必填 | |
查询SQL | generate_sql | code | 查询SQL, 编写自定义sql读取数据库中的数据 | 默认代码 | |
输出端 | 数据 | data | 通用 | 数据 |
#读取数据(SqlServer) (datahub_load_sqlserver.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 数据库连接 | conn | str | 数据库连接, 数据库连接字符串,username:password@host:port | *必填 |
数据库名称 | database | str | 数据库名称 | *必填 | |
查询SQL | generate_sql | code | 查询SQL, 编写自定义sql读取数据库中的数据 | 默认代码 | |
输出端 | 数据 | data | 通用 | 数据 |
#更新入库 (datahub_update_datasource.v4)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据通用 | input_data | 通用 | 数据通用 | *必填 |
输入参数 | 表名 | alias | str | 表名, 数据表名,用户数据系统会自动添加后缀"_U" | *必填 |
主键字段(必填) | primary_key | code | 主键字段(必填), 指定字段作为去重的索引, 多个使用逗号隔开 | 默认代码 | |
日期字段 | date_field | str | 日期字段, 日期所在字段的名称, 如果没有可不填 | ||
分表方式 | partition_date | choice | 分表方式, 数据将按照您选定的方式进行分库分表 | 无 | |
覆盖原数据 | rewrite | bool | 覆盖原数据, 是否删除旧数据只保留当前数据 | False | |
公开数据 | public | bool | 公开数据, 选择公开数据后数据对所有人可见 | False | |
中文表名 | friendly_name | str | 中文表名, 表的中文名称 | ||
表描述 | desc | str | 表描述, 描述表的数据分类和数据用途 | ||
只保留数据描述定义字段 | only_desc_fields | bool | 只保留数据描述定义字段 | False | |
数据字段描述 | fields | code | 数据字段描述, 对数据中的每列的含义和数据类型进行描述 | 默认代码 | |
数据文档 | show_doc | bool | 数据文档, 用户数据不会显示在文档中,只有系统数据勾选此项有效 | True | |
输出端 | 数据 | data | 通用 | 数据 |
# 因子研究
#因子分析 (factorlens.v1)
因子分析。对输入的因子公式或者因子数据,做因子分析。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入因子-来自输入特征列表等模块 | features | 通用 | 输入因子-来自输入特征列表等模块 | *必填 |
用户自定义特征数据 | user_factor_data | 通用 | 用户自定义特征数据 | None | |
输入参数 | 分析报告标题 | title | str | 分析报告标题, {factor_name}表示因子名 | 因子分析: {factor_name} |
开始日期 | start_date | str | 开始日期,分析数据开始日期 | 2019-01-01 | |
结束日期 | end_date | str | 结束日期,分析数据结束日期 | 2019-12-31 | |
调仓周期(交易日) | rebalance_period | int | 调仓周期(交易日),单位为交易日 | 22 | |
延迟建仓天数 | delay_rebalance_days | int | 延迟建仓天数 | 0 | |
收益价格 | rebalance_price | choice | 收益价格 | close_0 | |
股票池 | stock_pool | choice | 股票池 | 全市场 | |
分组数量 | quantile_count | int | 分组数量 | 5 | |
手续费及滑点 | commission_rate | float | 手续费及滑点 | 0.0016 | |
收益计算方式 | returns_calculation_method | choice | 收益计算方式 | 累乘 | |
收益率基准 | benchmark | choice | 收益率基准,选中无则计算绝对收益,选中其他基准则计算对应基准的相对收益(分组收益计算) | 无 | |
移除涨跌停股票 | drop_price_limit_stocks | bool | 移除涨跌停股票 | True | |
移除ST股票 | drop_st_stocks | bool | 移除ST股票 | True | |
移除新股 | drop_new_stocks | bool | 移除新股 | True | |
因子去极值和标准化 | normalization | bool | 因子去极值和标准化 | True | |
中性化风险因子 | neutralization | choice | 中性化风险因子。利用回归得到一个与风险因子线性无关的因子,用残差作为中性化后的新因子 | ['行业', '市值'] | |
指标 | metrics | choice | 指标。勾选需要输出的指标,不勾选为不输出 | ['因子表现概览', '因子分布', '因子行业分布', '因子市值分布', 'IC分析', '买入信号重合分析', '因子估值分析', '因子拥挤度分析', '因子值最大/最小股票', '表达式因子值', '多因子相关性分析'] | |
原始因子值覆盖率 | factor_coverage | float | 原始因子值覆盖率 | 0.5 | |
输出端 | 数据 | data | 通用 | 数据 |
#因子分析数据 (factorlens_data.v1)
获取因子分析数据,以键值对方式返回输入的因子 alias_id 列表对应的因子分析数据。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入因子-来自输入特征列表等模块 | factor_ids | 通用 | 输入因子-来自输入特征列表等模块 | *必填 |
输出端 | 因子分析数据 | data | 通用 | 因子分析数据,以输入因子名为键,对应因子分析数据为值的键值对形式存储 |
#保存因子 (factorlens_preservation.v1)
保存因子数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 因子数据 | factors_df | 通用 | 因子数据 | *必填 |
因子绩效数据 | performance_data | 通用 | 因子绩效数据 | *必填 | |
输入因子-来自输入特征列表等模块 | features | 通用 | 输入因子-来自输入特征列表等模块 | *必填 | |
输入参数 | 因子列 | factor_column | str | 因子列, 要保存的因子数据列名 | *必填 |
因子名 | factor_name | str | 因子名, 因子别名默认为数据列名 | ||
输出端 | 数据 | data | 通用 | 数据 |
# 数据可视化
#绘制DataFrame (plot_dataframe.v1)
绘制DataFrame。该绘图函数拥有更友好的交互体验和更强大的绘图功能,更多详情
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据 | input_data | 通用 | 数据 | *必填 |
输入参数 | 标题 | title | str | 标题 | |
图表类型 | chart_type | choice | 图表类型 | line | |
x轴数据字段 | x | str | x轴数据字段,如果不指定,默认用index | ||
y轴数据字段 | y | str | y轴数据字段,如果不指定,使用x轴外的所有字段,多个字段用英文逗号分隔 | ||
自定义参数 | options | code | 自定义参数,例如 {'chart': {'height': 500}},参考Highcharts文档 | 默认代码 | |
绘制蜡烛图 | candlestick | bool | 绘制蜡烛图,需要输入数据有 open、high、low、close四列 | False | |
分栏1 | pane_1 | str | 分栏1,用于将输入分为多个栏显示,这里输入访问本栏的字段,多个字段用英文逗号分隔,可以在最后添加一个栏的百分比高度,e.g. close,high,70% | ||
分栏2 | pane_2 | str | 分栏2,用于将输入分为多个栏显示,这里输入访问本栏的字段,多个字段用英文逗号分隔,可以在最后添加一个栏的百分比高度,e.g. close,high,70% | ||
分栏3 | pane_3 | str | 分栏3,用于将输入分为多个栏显示,这里输入访问本栏的字段,多个字段用英文逗号分隔,可以在最后添加一个栏的百分比高度,e.g. close,high,70% | ||
分栏4 | pane_4 | str | 分栏4,用于将输入分为多个栏显示,这里输入访问本栏的字段,多个字段用英文逗号分隔,可以在最后添加一个栏的百分比高度,e.g. close,high,70% |
#分位数分布 (plot_percentiles.v1)
技术和绘制数据分位数分布。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据源 | input_data | 通用 | 输入数据源 | *必填 |
输入参数 | 选中列 | include_columns | str | 选中列,多个列名用英文逗号分隔,默认所有列 | |
分位数数量 | percentile_count | int | 分位数数量 | 100 | |
起始分位 | percentile_start | float | 起始分位 | 0.0 | |
结束起始分位 | percentile_end | float | 结束起始分位 | 1.0 | |
输出端 | 数据 | data | 通用 | 数据 |
# 策略绩效评价
#平均持仓周期分析 (strategy_average_position_analysis.v1)
对传入的回测结果数据进行持仓分析,输出各时间段策略的平均持仓数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输出端 | 平均持仓天数 | data | 通用 | 平均持仓天数 |
#brinson归因分析 (strategy_brinson_analysis.v1)
对传入的回测结果数据进行净值归因分析,输出策略在各行业上的收益分布
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输入参数 | 基准指数代码 | benchmark_index | str | 基准指数代码 | 000300.HIX |
输出端 | 单期brinson数据 | single_brinson | 通用 | 单期brinson数据 | |
多期brinson数据 | multi_brinson | 通用 | 多期brinson数据 |
#策略风险概览 (strategy_evaluate_risk_overview.v1)
对传入的回测结果数据进行风险分析,输出动态回撤图及策略各风险指标数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输出端 | 回撤指标 | data | 通用 | 回撤指标 |
#策略收益分布 (strategy_income_distribution.v1)
对传入的回测结果数据进行收益分布分析,输出策略及基准各时间段的收益数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输出端 | 策略收益分布指标 | data | 通用 | 策略收益分布指标 |
#策略区间收益 (strategy_interval_return.v1)
对传入的回测结果数据进行区间收益分析,输出各时间段及各区间的策略及基准收益情况
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输出端 | 策略收益分布指标 | data | 通用 | 策略收益分布指标 |
#每日top10持仓分析 (strategy_top10_position_analysis.v1)
用于回测结果分析。分析每日持仓股票的行业分布和数量分布。输出持仓行业市值和top10持仓的股票。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | backtest_ds | 通用 | 回测详细数据 | None |
输出端 | 每日各行业市值(申万一级) | industry_market_value_daily | 通用 | 每日各行业市值(申万一级) | |
每日的top10持仓 | top10_positions | 通用 | 每日的top10持仓 |
#换手率分析 (strategy_turn_analysis.v1)
对传入的回测结果数据进行换手率分析,输出该策略换手率随时间的分布图
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测详细数据 | raw_perf | 通用 | 回测详细数据 | *必填 |
输出端 | 回撤指标 | data | 通用 | 回撤指标 |
# 用户模块
#因子提取 (CCC1.v1)
开发者: nolamebrand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | table | table | str | *必填 | |
fillna_method | fillna_method | choice | ffill | ||
输出端 | data_1 | data_1 | 通用 |
#CKCL (CKCL.v1)
处理窗口输出数据
开发者: ahxdct
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#生成模型评估时间 (CMPD.v1)
开发者: tionase
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#生成模型回归评估数据 (CMPDD.v1)
开发者: tionase
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#板块筛除 (Concept.v1)
开发者: donkyxote
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#板块因子计算 (ConceptAve.v1)
开发者: donkyxote
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#DQN训练预测 (DQN_df.v1)
针对训练集和预测集DataFrame数据训练和预测
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练集数据 | input_1 | 通用 | 训练集数据 | *必填 |
预测集数据 | input_2 | 通用 | 预测集数据 | *必填 | |
输入参数 | batch_size | batch_size | int | batch_size | 32 |
window_size | window_size | int | window_size | 5 | |
total_episode | total_episode | int | total_episode | 5 | |
epsilon_decay | epsilon_decay | float | epsilon_decay | 0.995 | |
learning_rate | learning_rate | float | learning_rate | 0.01 | |
gamma | gamma | float | gamma | 0.95 | |
输出端 | 预测数据 | data_1 | 通用 | 预测数据 |
#DQN_model (DQN_model.v9)
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练集数据 | data | 通用 | 训练集数据 | *必填 |
测试集数据 | data_2 | 通用 | 测试集数据 | *必填 | |
输出端 | 预测结果 | data_1 | 通用 | 预测结果 |
#DQN_tf2 (DQN_tf2.v1)
DQN使用tensorflow2.0
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | input_1 | 通用 | 训练数据 | *必填 |
测试数据 | input_2 | 通用 | 测试数据 | *必填 | |
输入参数 | batch_size | batch_size | int | batch_size | 32 |
window_size | window_size | int | window_size | 5 | |
total_episode | total_episode | int | total_episode | 5 | |
epsilon_decay | epsilon_decay | float | epsilon_decay | 0.995 | |
learning_rate | learning_rate | float | learning_rate | 0.01 | |
gamma | gamma | float | gamma | 0.95 | |
输出端 | 预测结果 | data_1 | 通用 | 预测结果 |
#DQN_v2 (DQN_v2.v3)
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | input_1 | 通用 | 训练数据 | *必填 |
测试数据 | input_2 | 通用 | 测试数据 | *必填 | |
输入参数 | batch_size | batch_size | int | batch_size | 32 |
window_size | window_size | int | window_size | 5 | |
total_episode | total_episode | int | total_episode | 5 | |
epsilon_decay | epsilon_decay | float | epsilon_decay | 0.995 | |
learning_rate | learning_rate | float | learning_rate | 0.01 | |
gamma | gamma | float | gamma | 0.95 | |
输出端 | 预测结果 | data_1 | 通用 | 预测结果 |
#Datasys (Datasys.v1)
封装一个bigquant数据获取类
开发者: stock
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 获取收盘价 | input_pice_data | 通用 | 获取收盘价 | *必填 |
获取财务数据 | input_df_data | 通用 | 获取财务数据 | *必填 | |
获取指数成份股标记 | input_index_data | 通用 | 获取指数成份股标记 | *必填 | |
获取m2数据 | input_m2_data | 通用 | 获取m2数据 | *必填 | |
获取十年国债数据 | input_debt_data | 通用 | 获取十年国债数据 | *必填 | |
输出端 | 输出一个对象 | data | 通用 | 输出一个对象 |
#Datasys2 (Datasys2.v7)
数据提取及处理,提供数据调用接口
开发者: helman
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_pice_data | input_pice_data | 通用 | *必填 | |
input_fs_data | input_fs_data | 通用 | *必填 | ||
input_index_data | input_index_data | 通用 | *必填 | ||
input_m2_data | input_m2_data | 通用 | *必填 | ||
input_debt_data | input_debt_data | 通用 | *必填 | ||
输出端 | data | data | 通用 |
#特征提取(表名+字段名) (FE1.v1)
开发者: nolamebrand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 基础特征抽取后数据 | input_1 | 通用 | 基础特征抽取后数据 | *必填 |
输入参数 | table | table | str | {'bar1d_CN_STOCK_A': ['high']} | |
fillna_method | fillna_method | choice | bfill | ||
输出端 | data_1 | data_1 | 通用 |
#因子自定义分析 (FactorA.v4)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据源 | input_1 | 通用 | 数据源 | *必填 |
input_2 | input_2 | 通用 | *必填 | ||
输入参数 | start_date | start_date | str | 2020-01-01 | |
end_date | end_date | str | 2021-05-09 | ||
rabalance_period | rabalance_period | int | 22 | ||
buy_commission_rate | buy_commission_rate | float | 0.0005 | ||
sell_commission_rate | sell_commission_rate | float | 0.0005 | ||
ic_method | ic_method | str | Rank_IC | ||
quantile_num | quantile_num | int | 5 | ||
is_standardlize | is_standardlize | bool | True | ||
is_winsorize | is_winsorize | bool | True | ||
输出端 | data_1 | data_1 | 通用 | data_1 | |
data_2 | data_2 | 通用 |
#自定义因子分析 (Factor_Analyst_20210510.v1)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据源 | input_1 | 通用 | 数据源 | *必填 |
因子列表 | input_2 | 通用 | 因子列表 | *必填 | |
输入参数 | start_date | start_date | str | 2019-01-01 | |
end_date | end_date | str | 2021-01-01 | ||
调仓周期 | rabalance_period | int | 调仓周期 | 22 | |
买入成本 | buy_commission_rate | float | 买入成本 | 0.0005 | |
卖出成本 | sell_commission_rate | float | 卖出成本 | 0.0005 | |
IC计算方式 | ic_method | choice | IC计算方式 | Rank_IC | |
分层数量 | quantile_num | int | 分层数量 | 5 | |
是否标准化 | is_standardlize | bool | 是否标准化 | True | |
是否去极值 | is_winsorize | bool | 是否去极值 | True | |
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#因子抽取1 (Feat_Extract_v1.v1)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征抽取后数据 | input_1 | 通用 | 特征抽取后数据 | *必填 |
输入参数 | table | table | str | {"table_name":["fields_name"]} | |
fillna_method | fillna_method | choice | ffill | ||
输出端 | data_1 | data_1 | 通用 |
#因子抽取 (Feature_ex_v1.v1)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | table | table | str | *必填 | |
fillna_method | fillna_method | choice | ffill | ||
输出端 | data_1 | data_1 | 通用 |
#特征抽取(表名+字段名) (Features_Extractor_v1.v1)
开发者: nolamebrand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征抽取后的数据 | input_1 | 通用 | 特征抽取后的数据 | *必填 |
输入参数 | table | table | str | *必填 | |
fillna_method | fillna_method | choice | ffill | ||
输出端 | data_1 | data_1 | 通用 |
#Final (Final.v1)
开发者: dingdingdong
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#当日涨停跌停k日最高 (Find_the_top_stocks.v2)
寻找涨停跌停二十日最高最低的股票
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 数据 | input_1 | 通用 | 数据 | *必填 |
查询日期 | input_2 | 通用 | 查询日期 | *必填 | |
k日 | input_3 | 通用 | k日 | *必填 | |
输出端 | 一个字典(四张表) | data_1 | 通用 | 一个字典(四张表) |
#期货价差行情数据抽取 (Future_Spread_HQ.v3)
根据指定的两个期货品种A和B,计算每日主力合约价差,返回价差合约Spread8888.SP的行情数据close、open、high、low、amount、volume
支持利用基础字段分别计算单合约的表达式因子,基础字段为close_A、amountB等期货行情表数据字段
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始日期 | start_ | str | 开始日期 | 2019-01-01 |
结束日期 | end_ | str | 结束日期 | 2020-01-01 | |
品种A | ins_A | str | 品种A | RB | |
品种B | ins_B | str | 品种B | JM | |
自定义单合约因子 | single_factors | code | 自定义单合约因子 | 默认代码 | |
自定义价差计算方式 | spread_factors | code | 自定义价差计算方式 | 默认代码 | |
输出端 | 输出结果 | data | 通用 | 输出结果 |
#遗传规划模型预测(GP) (GP_predict.v2)
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | GP训练模型 | input_1 | 通用 | GP训练模型 | *必填 |
训练因子列表 | input_2 | 通用 | 训练因子列表 | *必填 | |
验证集数据 | input_3 | 通用 | 验证集数据 | *必填 | |
输出端 | 预测结果 | data_1 | 通用 | 预测结果 |
#当日行情数据获取 (Get_Data.v7)
获取当天和前n天的股票市场数据
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | today | today | str | 2018-01-08 | |
k | k | int | 300 | ||
输出端 | 股票统计所需行情数据 | data_1 | 通用 | 股票统计所需行情数据 | |
查询日期 | data_2 | 通用 | 查询日期 | ||
回溯天数 | data_3 | 通用 | 回溯天数 |
#获取SW宏源行业收益率数据 (Get_Industry_return.v5)
用于获取所以申万行业的收益率数据表
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 查询日期 | today | 通用 | 查询日期 | *必填 |
输入参数 | n日收益率 | n_day | int | n日收益率 | 1 |
输出端 | 行业收益率表 | data_1 | 通用 | 行业收益率表 |
#Get_industry_index_return (Get_industry_index_return.v1)
Calculate the n_days return for all SW indexes
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | Datasource contains the industry indexes | input_1 | 通用 | Datasource contains the industry indexes | *必填 |
输入参数 | Start date | start_date | str | Start date | 2018-01-01 |
End date | end_date | str | End date | 2018-10-01 | |
N days return you want to get | n_days | str | N days return you want to get | 5 | |
输出端 | data | data | 通用 |
#HS300Trade_signal (HS300Trade_signal.v21)
生成交易信号
开发者: helman
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#指数构建 (Index_construct.v3)
根据股票权重的DataFame构建指数,股票列名为instrument,起止时间为DataFame决定
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入股票权重数据 | input_1 | 通用 | 输入股票权重数据 | *必填 |
输入参数 | 指定权重列名 | weight_column | str | 指定权重列名 | w |
指定图名 | title | str | 指定图名 | 指数阶段走势 | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#Industry_Sta (Industry_Sta.v1)
Show the statistis of industry
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | The raw data | input_1 | 通用 | The raw data | *必填 |
输入参数 | The day you want to see the industry | date_ | str | The day you want to see the industry | 2018-08-17 |
The number of industries | n | str | The number of industries | 5 | |
The best or the worst | type_ | str | The best or the worst | Desc | |
输出端 | data | data | 通用 |
#行业当日最(高/低) (Industry_top_stocks.v8)
给定行业,找出在给定日期内收益率最高(Desc)或最低(Asc)的股票
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 查询日期 | input_1 | 通用 | 查询日期 | *必填 |
输入参数 | 查询百分比 | port | float | 查询百分比 | 0.1 |
行业代码 | Code | int | 行业代码 | 410000 | |
排列方式 | type1 | str | 排列方式 | Desc | |
n日收益率 | n | int | n日收益率 | 10 | |
输出端 | 数据 | data_1 | 通用 | 数据 | |
日期 | data_2 | 通用 | 日期 | ||
排序方式 | data_3 | 通用 | 排序方式 |
#Jam_Load_model (Jam_Load_model.v1)
开发者: jamesy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | model_dir | model_dir | str | model | |
输出端 | data_1 | data_1 | 通用 |
#Jim_Load_Model (Jim_Load_Model.v10)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | 预训练模型的地址 | model_dir | str | 预训练模型的地址 | 0 |
输出端 | data_1 | data_1 | 通用 | data_1 | |
data_2 | data_2 | 通用 | data_2 |
#LG_CYB (LG_CYB.v1)
过滤创业板
开发者: long236076535
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#LV_TSG (LV_TSG.v1)
过滤退市股
开发者: long236076535
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#MOKUAI (MOKUAI.v1)
开发者: tonytony
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#股票池模块 (Moor_1.v1)
代码复制粘贴到 自定义python模块主函数部分
Python 代码入口函数,input_1/2/3 对应三个输入端,data_1/2/3 对应三个输出端
def bigquant_run(input_1, input_2, input_3):
# 示例代码如下。在这里编写您的代码
df = DataSource("index_constituent_CN_STOCK_A").read() # 读取A股指数成分表,具体信息见 数据文档-A股-其他常规数据-A股指数成分
df_csi300 = df[df.in_csi300==1] #选取 沪深300 的记录
ins_list = df_csi300.instrument.tolist() # 获取对应的 instruments列表
data_1 = {'end_date': '2015-01-01','instruments':ins_list,'start_date':'2010-01-01'} #输出格式和原代码列表模块输出格式保持一致,代码列表输出格式可通过 m1.data.read()看到
return Outputs(data_1=data_1, data_2=None, data_3=None) #只需要用到一个输出端,可以把另外两个设为 None。
开发者: moor
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#中性化处理 (Neutral.v3)
数据中性化处理
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | year | year | int | year | 2016 |
#OutlierClipper (OutlierClipper.v2)
极值裁剪
开发者: jacywang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 待处理数据 | input_1 | 通用 | 待处理数据 | *必填 |
因子列表 | input_2 | 通用 | 因子列表 | *必填 | |
输入参数 | lower | lower | float | lower | 0.1 |
upper | upper | float | upper | 0.9 | |
输出端 | data | data | 通用 | data |
#PredictionDecorate (PredictionDecorate.v14)
模型预测值装饰模块..
开发者: jacywang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练集预测值 | input_1 | 通用 | 训练集预测值 | *必填 |
测试集预测值 | input_2 | 通用 | 测试集预测值 | *必填 | |
测试集真实数据 | input_3 | 通用 | 测试集真实数据 | *必填 | |
拼接数据的输入接口 | input_4 | 通用 | 拼接数据的输入接口 | *必填 | |
输入参数 | 交易阈值 | threshold | float | 交易阈值 | 0.7 |
开平仓比 | oc_ratio | float | 开平仓比 | 1 | |
是否使用预生成的交易信号 | use_trade_sig | bool | 是否使用预生成的交易信号 | True | |
使用固定阈值 | use_fixed_thre | bool | 使用固定阈值 | *必填 | |
交易阈值 | fixed_thre | code | 交易阈值, 表示[buy_open, sell_close, sell_open, buy_close]阈值 | 默认代码 | |
输出端 | DataFrame格式的数据 | data | 通用 | DataFrame格式的数据,列名['pred', 'date', 'instrument', 'trade_threshold', 'buy_open', 'sell_close', 'sell_open', 'buy_close', 'use_trade_sig', 'threshold', 'oc_ratio'] |
#列重命名 (RNAME_YZ.v1)
开发者: user2087
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#Return10 (Return10.v4)
开发者: upton1919
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#RobustScaler (RobustScaler.v13)
标准化或者归一化,可以按天或者全局
开发者: brantyz
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | train_ds | train_ds | 通用 | *必填 | |
features | features | 通用 | *必填 | ||
test_ds | test_ds | 通用 | *必填 | ||
输入参数 | scale_type | scale_type | choice | standard | |
quantile_range_min | quantile_range_min | float | 0.01 | ||
quantile_range_max | quantile_range_max | float | 0.99 | ||
global_scale | global_scale | bool | True | ||
输出端 | train_data | train_data | 通用 | ||
test_data | test_data | 通用 |
#RobustScaler_debug (RobustScaler_debug.v2)
开发者: zybzzc
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | input_2 | *必填 | |
input_3 | input_3 | 通用 | input_3 | *必填 | |
输入参数 | scale_type | scale_type | choice | scale_type | standard |
quantile_range_min | quantile_range_min | int | quantile_range_min | 1 | |
quantile_range_max | quantile_range_max | int | quantile_range_max | 99 | |
输出端 | data_1 | data_1 | 通用 | data_1 | |
data_2 | data_2 | 通用 | data_2 | ||
data_3 | data_3 | 通用 | data_3 |
#展示行业行情排序 (Show_industry_rank.v3)
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 查询日期 | input_1 | 通用 | 查询日期 | *必填 |
行业收益率数据 | input_2 | 通用 | 行业收益率数据 | *必填 | |
输入参数 | type1 | type1 | str | Asc | |
n1 | n1 | int | 5 | ||
输出端 | 排序数据 | data_1 | 通用 | 排序数据 | |
排序方式 | data_2 | 通用 | 排序方式 | ||
展示数量 | data_3 | 通用 | 展示数量 |
#创业板剔除 (StockFilter.v1)
开发者: donkyxote
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#StockRanker预测结果分组回测 (StockRanker_grouptest.v3)
根据StockRanker预测排序分五组进行简易回测并展示各组净值曲线
开发者: tmao1996
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测集证券代码列表 | input_1 | 通用 | 预测集证券代码列表 | *必填 |
StockRanker预测结果 | input_2 | 通用 | StockRanker预测结果 | *必填 | |
预测集缺失值处理数据 | input_3 | 通用 | 预测集缺失值处理数据 | *必填 | |
输入参数 | 指定收益率列名 | ret_column | str | 指定收益率列名 | shift(close_0,-22)/close_0-1 |
指定换仓周期 | N | int | 指定换仓周期 | 22 |
#TiChuChuangYeBan (TiChuChuangYeBan.v1)
开发者: ruinao123
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#Top_stocks (Top_stocks.v1)
开发者: xiaoyudu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | port | port | str | 0.1 | |
Code | Code | str | 340000 | ||
type1 | type1 | str | Desc | ||
date1 | date1 | str | 2018-05-02 | ||
date2 | date2 | str | 2018-05-18 | ||
输出端 | data_1 | data_1 | 通用 |
#T.plot绘图 (Tplot.v1)
使用T.plot命令绘图
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_ds | 通用 | 输入数据 | *必填 |
输入参数 | 指定x轴列名 | x | str | 指定x轴列名 | date |
指定y轴列名 | y | str | 指定y轴列名,多列之间逗号分隔 | open,high,low,close | |
指定图名 | title | str | 指定图名 | 折线图 | |
指定类型 | chart_type | choice | 指定类型 | scatter | |
自定义选项设置 | chart_options | code | 自定义选项设置 | 默认代码 |
#绘制DataFrame (Tplot_COPY.v11)
使用T.plot命令绘制DataFrame
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定y轴列名 | y | str | 指定y轴列名,多列之间逗号分隔 | open,high,low,close,amount |
指定图名 | title | str | 指定图名 | K线图 | |
指定类型 | chart_type | choice | 指定类型 | candlestick | |
自定义选项设置 | chart_options | code | 自定义选项设置 | 默认代码 |
#Transfer_to_week_data (Transfer_to_week_data.v1)
开发者: moyota
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#过滤模块 (aa.v5)
过滤st股票,退市股票,科创板股票,新上市股票(day_number可选上市多少天)
开发者: blsn
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
输入参数 | 新上市股票过滤天数 | day_number | int | 新上市股票过滤天数 | 100 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#aaaaaa (aaaaa.v1)
aa
开发者: lu200096
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | before_days | before_days | int | 60 |
#321 (abctester.v1)
321
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param0 | param0 | int | param0 | 3 |
#ac1 (ac1.v1)
开发者: cgy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#alan4 (alan4.v1)
开发者: albertech
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | ds5m | ds5m | 通用 | *必填 | |
ds15m | ds15m | 通用 | *必填 | ||
ds30m | ds30m | 通用 | *必填 | ||
ds60m | ds60m | 通用 | *必填 | ||
输入参数 | All | All | bool | True | |
M5 | M5 | bool | True | ||
M15 | M15 | bool | True | ||
M30 | M30 | bool | True | ||
M60 | M60 | bool | True | ||
输出端 | data | data | 通用 |
#alfred0011 (alfred001.v1)
开发者: alfred1993
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#analysis_v1 (analysis_v1.v1)
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | factor | factor | str | market_cap_0 | |
N | N | int | 10 | ||
is_industry | is_industry | bool | True | ||
is_market | is_market | bool | *必填 | ||
start_date | start_date | str | 2018-01-01 | ||
end_data | end_data | str | 2018-12-31 | ||
输出端 | data_1 | data_1 | 通用 | ||
回归法分析结果 | data_2 | 通用 | 回归法分析结果 | ||
分层回测法分析结果 | data_3 | 通用 | 分层回测法分析结果 |
#anguo测试 (anguo.v2)
anguo测试anguo测试22
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 第一个输入端 | input_1 | 通用 | 第一个输入端 | *必填 |
第2个输入端 | input_2 | 通用 | 第2个输入端 | *必填 | |
第3个输入端 | input_3 | 通用 | 第3个输入端 | *必填 | |
第4个输入端 | input_4 | 通用 | 第4个输入端 | *必填 | |
输入参数 | CPU数量 | a | int | CPU数量 | 1 |
123123 | b | str | 123123 | ss | |
输出端 | 第一个输出 | data_1 | 通用 | 第一个输出 | |
第二个输出 | data_2 | 通用 | 第二个输出 |
#anguo_wei (anguo_wei.v3)
anguo_wei
开发者: user3180h
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
input_3 | input_3 | 通用 | *必填 | ||
input_4 | input_4 | 通用 | *必填 | ||
输入参数 | a | a | int | 1 | |
b | b | str | ss | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#backtest_csv (backtest_csv.v4)
回测记录生成csv文件
开发者: anzaixiu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测模块结果 | input_1 | 通用 | 回测模块结果 | *必填 |
输入参数 | 保存的csv文件名称 | name | str | 保存的csv文件名称 | 交易记录 |
#bala0608 (bala0608.v1)
开发者: balaroth
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#单品种期货合约日线数据 (bar1d_futures.v2)
给定期货品种获取所有合约日线数据
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始日期 | start | str | 开始日期 | 2019-01-01 |
结束日期 | end | str | 结束日期 | 2020-01-01 | |
品种代码 | code_start | str | 品种代码 | RU | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#单品种期货历史分钟数据 (bar1m_futures.v3)
单品种期货历史分钟数据
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始时间 | start | str | 开始时间 | 2019-01-01 |
结束时间 | end | str | 结束时间 | 2020-01-01 | |
期货品种 | code_start | str | 期货品种 | RU | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#baro0525 (baro0525.v1)
开发者: balaroth
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#分钟数据批量获取 (batch_get_minute_price.v8)
分钟数据批量获取
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 证券代码 | instruments | code | 证券代码,空列表会默认转化为全市场股票列表 | 默认代码 |
开始时间 | start_time | str | 开始时间,具体到分钟 | 2019-07-15 9:00 | |
结束时间 | end_time | str | 结束时间,具体到分钟 | 2019-07-19 14:30 | |
输出端 | data_1 | data_1 | 通用 |
#bbc_winsorize (bbc_winsorize.v7)
开发者: upton1919
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#看板因子数据读取 (board_factor_read.v1)
根据输入特征列表指定的看板因子ID抽取代码列表模块中的股票池和时间范围内的数据
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | input_1 | 通用 | 代码列表 | *必填 |
输入参数 | 指定看板因子ID | features | code | 指定看板因子ID | 默认代码 |
输出端 | 看板因子数据 | data_1 | 通用 | 看板因子数据 |
#bzhmk (bzhmk.v1)
开发者: focus777
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#统计某年数据条数 (cal_count_by_year.v5)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | year | year | int | year | 2016 |
#calu_tim (calu_tim.v4)
开发者: lylelai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | last_lime | input_1 | 通用 | last_lime | *必填 |
执行顺序 | input_2 | 通用 | 执行顺序 | *必填 | |
输出端 | now_time | data_1 | 通用 | now_time | |
执行顺序 | data_2 | 通用 | 执行顺序 |
#calu_time (calu_time1.v2)
开发者: itsatest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | today | today | str | 2018-01-08 | |
k | k | int | 300 | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 | |||
data_3 | data_3 | 通用 |
#calu_time_v1 (calu_time_v1.v5)
开发者: itsatest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | last_time | input_1 | 通用 | last_time | *必填 |
输出端 | now_time | data_1 | 通用 | now_time |
#calu_time (calu_time_v2.v4)
开发者: itsatest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | last_time | input_1 | 通用 | last_time | *必填 |
执行顺序 | input_2 | 通用 | 执行顺序 | *必填 | |
输出端 | now_time | data_1 | 通用 | now_time | |
执行顺序 | data_2 | 通用 | 执行顺序 |
#ccb_adjust_extreme (ccb_adjust_extreme.v4)
开发者: highhand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | adjust | adjust | str | adjust | to3delta |
输出端 | data_1 | data_1 | 通用 | data_1 |
#ccb_group (ccb_group.v1)
开发者: highhand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | group_num | group_num | int | 10 | |
输出端 | data_1 | data_1 | 通用 |
#ccb_standardize (ccb_standardize.v1)
开发者: highhand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | standardize_name | standardize_name | str | m1 | |
输出端 | data_1 | data_1 | 通用 |
#change_columns (change_columns.v1)
改变列名
开发者: lpl22
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | columns | columns | str | adjust_factor:new_adjust_factor|rank_return_0/rank_return_5:return_change_5 | |
输出端 | data | data | 通用 |
#列值过滤 (col_value_filter.v1)
输入两个DataFrame 指定列名,根据第一个DataFrame的列值过滤第二个DataFrame
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 条件列所在DataFrame | input_1 | 通用 | 条件列所在DataFrame | *必填 |
需要过滤的DataFrame | input_2 | 通用 | 需要过滤的DataFrame | *必填 | |
输入参数 | 指定过滤的列名 | column | str | 指定过滤的列名 | instrument |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#指定列值关键词过滤 (column_str_filter.v2)
指定字符串数据类型的列名和关键字,按指定列过滤出包含关键字的数据行
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定列名 | col | str | 指定列名 | concept |
指定过滤关键词 | substr | str | 指定过滤关键词 | 5G | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#comb_mark (comb_mark.v3)
开发者: james_3
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_2 | input_2 | 通用 | input_2 | *必填 |
input_3 | input_3 | 通用 | input_3 | *必填 | |
输入参数 | mark | mark | str | mark | 测试 |
输出端 | data_1 | data_1 | 通用 | data_1 |
#组合日频分钟因子(4输入) (combine_daily_min_factors_4_input.v1)
将分钟频率因子组合成日频数据
开发者: dreamerfund
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 5分钟因子数据源 | ds5m | 通用 | 5分钟因子数据源 | *必填 |
15分钟因子数据源 | ds15m | 通用 | 15分钟因子数据源 | *必填 | |
30分钟因子数据源 | ds30m | 通用 | 30分钟因子数据源 | *必填 | |
60分钟因子数据源 | ds60m | 通用 | 60分钟因子数据源 | *必填 | |
输入参数 | 组合全部因子 | All | bool | 组合全部因子 | True |
组合5分钟因子 | M5 | bool | 组合5分钟因子 | True | |
组合15分钟因子 | M15 | bool | 组合15分钟因子 | True | |
组合30分钟因子 | M30 | bool | 组合30分钟因子 | True | |
组合60分钟因子 | M60 | bool | 组合60分钟因子 | True | |
输出端 | 组合后的日频因子数据 | data | 通用 | 组合后的日频因子数据 |
#备注 (comments.v1)
用于信息备注。什么都不做
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#common_filter (common_filter.v1)
开发者: zhanglan
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#concat_data (concat_data.v1)
开发者: yingke
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
input_3 | input_3 | 通用 | *必填 | ||
input_4 | input_4 | 通用 | *必填 | ||
input_5 | input_5 | 通用 | *必填 |
#拼接数据 (concat_inputs.v4)
拼接多个数据源的输入数据
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
input_3 | input_3 | 通用 | *必填 | ||
input_4 | input_4 | 通用 | *必填 | ||
输入参数 | 排序 | sort_by | str | 排序,如果指定,则对拼接后的数据排序,多个列用英文逗号分隔 | '' |
输出端 | data | data | 通用 |
#csv_read (csv_read.v3)
csv文件读取,转换成DataSource
开发者: outside
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | csv_path | csv_path | str | *必填 | |
encoding | encoding | str | utf-8 | ||
输出端 | data | data | 通用 |
#计算累计数 (cumsum.v2)
对'date'以外的列计算累计数
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#custom_test (custom_test.v2)
custom_test just for test
开发者: robertfeng
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | input_ds | *必填 |
输出端 | data | data | 通用 | data |
#data_clear (data_clear.v1)
数据清洗全流程
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#data_index_rename (data_index_rename.v1)
数据以日期为依据升序排列,并索引重命名
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#连接数据 (data_join.v3)
按需连接两个输入数据
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 第一个输入数据 | input_1 | 通用 | 第一个输入数据 | *必填 |
第二个输入数据 | input_2 | 通用 | 第二个输入数据 | *必填 | |
输入参数 | 关联列 | on | str | 关联列 | date,instrument |
连接方式 | how | choice | 连接方式 | inner | |
对结果排序 | sort | bool | 对结果排序 | *必填 | |
输出端 | 连接后的数据 | data | 通用 | 连接后的数据 |
#data_label (data_label.v1)
自定义数据标注
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#数据清洗(预处理) (dataclean.v35)
数据清洗(数据预处理,包括缺失值处理、无穷值处理、极值处理、中性化、标准化、主成分分析PCA),目的是使得因子数据摆脱缺失值、无穷值、异常值、行业、市值、量纲、多重共线性的影响。
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 待清洗数据1 | feature_data1 | 通用 | 待清洗数据1 | *必填 |
待清洗数据2 | feature_data2 | 通用 | 待清洗数据2 | *必填 | |
待清洗因子列表 | cleaning_feature_list | 通用 | 待清洗因子列表 | *必填 | |
中性化因子列表 | neutral_feature_list | 通用 | 中性化因子列表 | *必填 | |
输入参数 | 缺失值处理方法 | nan_method | choice | 缺失值处理方法 | *必填 |
极值处理方法 | outlier_method | choice | 极值处理方法 | *必填 | |
主成分数量或比例(n_components) | n_components | float | 主成分数量或比例(n_components) | 0.98 | |
因子分组长度(每组因子数量 | grp_len | int | 因子分组长度(每组因子数量,若为0则不分组) | 10 | |
是否处理缺失值? | if_nan | bool | 是否处理缺失值? | *必填 | |
是否处理无穷值? | if_inf | bool | 是否处理无穷值? | *必填 | |
是否处理异常值? | if_outlier | bool | 是否处理异常值? | *必填 | |
是否执行中性化? | if_neutralize | bool | 是否执行中性化? | *必填 | |
结果保留中性化因子? | neutral_feature_remained | bool | 结果保留中性化因子? | *必填 | |
是否标准化? | if_standardize | bool | 是否标准化? | *必填 | |
是否执行PCA? | if_pca | bool | 是否执行PCA? | *必填 | |
输出端 | 清洗后数据1 | cleaned_data1 | 通用 | 清洗后数据1 | |
清洗后数据2 | cleaned_data2 | 通用 | 清洗后数据2 | ||
清洗后因子列表 | cleaned_factors | 通用 | 清洗后因子列表 |
#日期增加天数 (date_add_days.v2)
给数据集的日期列,增加指定天数,一般用于数据复制,通过修改date来改变id
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | 增加的天数 | add_days | float | 增加的天数 | 1 |
日期列名 | date_column_name | str | 日期列名 | "date" | |
输出端 | data | data | 通用 |
#ddr11 (ddr11.v2)
开发者: ddr
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | [4, 6] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 |
#ddr6 (ddr6.v1)
开发者: ddr
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | ['4', '6'] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 |
#ddr7 (ddr7.v1)
开发者: ddr
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | 4 | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 |
#ddr_test3 (ddr_test3.v1)
开发者: ddr
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | 4 | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 |
#debt_data (debt_data.v3)
导入本地的十年国债利率数据
开发者: helman
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 |
#删除开始日期前数据 (del_data_before_startdate.v2)
删除代码模块所载开始日期前的数据
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 待删除数据 | input_1 | 通用 | 待删除数据 | *必填 |
开始日期(接代码模块输出) | input_2 | 通用 | 开始日期(接代码模块输出) | *必填 | |
输出端 | 删除后的数据 | data | 通用 | 删除后的数据 |
#删除指定列 (delete_common.v1)
指定将要删除的列名
开发者: kilmjin
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#delete_ssd (delete_ssd.v1)
开发者: ft2728244
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#保存csv文件 (df_save_to_csv.v1)
将DataFrame保存为csv文件(加了index=False)
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入csv | input_1 | 通用 | 输入csv | *必填 |
输入参数 | 指定文件名 | name | str | 指定文件名 | xxx.csv |
#保存csv文件 (df_save_to_csv_Copy.v4)
将DataFrame保存为csv文件(加了index=False)
开发者: adhaha111
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | test | test | str | test | [1, 2] |
#绘制DataFrame基础统计信息 (df_stastic.v6)
绘制DataFrame各列均值、方差、协方差热力图、相关系数热力图,可以指定/排除参与统计的列名
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入DataFrame | input_1 | 通用 | 输入DataFrame | *必填 |
输入参数 | 指定列填0 排除列填1 | type_num | int | 指定列填0 排除列填1 | 1 |
指定/排除参与统计的列名 | columns | code | 指定/排除参与统计的列名 | 默认代码 |
#保存csv文件 (df_to_csv.v2)
将DataFrame保存为csv文件
开发者: hxjj001
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入csv | input_1 | 通用 | 输入csv | *必填 |
输入参数 | 指定文件名 | name | str | 指定文件名 | xxx.csv |
#保存csv文件 (df_to_csv_Copy.v1)
将DataFrame保存为csv文件
开发者: blsm001
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入csv | input_1 | 通用 | 输入csv | *必填 |
输入参数 | 指定文件名 | name | str | 指定文件名 | xxx.csv |
#dfadfasddf (dfadfasddf.v1)
开发者: rydeng
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds1 | input_ds1 | 通用 | *必填 | |
输入参数 | train_start | train_start | str | 2010-01-01 | |
train_end | train_end | str | 2015-01-01 | ||
test_start | test_start | str | 2015-01-01 | ||
test_end | test_end | str | 2018-09-20 | ||
freq | freq | str | 5 | ||
stock_count | stock_count | str | 20 | ||
ratio_max | ratio_max | str | 0.1 | ||
pos_gradient | pos_gradient | str | 10 | ||
capital_start | capital_start | str | 10000000 | ||
market_train | market_train | str | 全市场 | ||
market_test | market_test | choice | 全市场 | ||
benchmark_ins | benchmark_ins | str | IC0000.CFE | ||
输出端 | data | data | 通用 |
#dick001 (dick001.v1)
开发者: alfred1993
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#股票代码过滤 (exclude_stock_filter.v3)
指定去除的股票列表,过滤数据
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定去除的股票使用逗号分隔 | exclude_stock_list | code | 指定去除的股票使用逗号分隔 | 默认代码 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#exercise_1 (exercise_1.v1)
修改数据列名
开发者: lpl22
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | columns | columns | str | adjust_factor:new_adjust_factor|rank_return_0/rank_return_5:return_change_5 | |
输出端 | data | data | 通用 |
#export_plan (export_plan.v22)
开发者: james_5
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | input_2 | *必填 | |
input_3 | input_3 | 通用 | input_3 | *必填 |
#分钟数据混合日线因子抽取 (extract_minute_daily.v3)
抽取分钟数据,混合抽取日线因子
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | input_1 | 通用 | 代码列表 | *必填 |
输入参数 | 日线特征列表 | features | code | 日线特征列表 | 默认代码 |
日线特征计算向前抽取天数 | before_days | int | 日线特征计算向前抽取天数 | 10 | |
输出端 | 混合日线因子分钟数据 | data | 通用 | 混合日线因子分钟数据 |
#因子分析-lite版 (factor_analysis_lite.v14)
因子分析-lite版
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始时间 | 开始时间 | str | 开始时间 | 2018-09-01 |
结束时间 | 结束时间 | str | 结束时间 | 2019-03-03 | |
股票池 | 股票池 | choice | 股票池 | 沪深300 | |
因子或因子表达式 | 因子或因子表达式 | str | 因子或因子表达式 | -1*correlation(close_0,ts_max(close_0,30),30) | |
调仓周期 | 调仓周期 | int | 调仓周期 | 21 | |
买入成本 | 买入成本 | float | 买入成本 | 0.0003 | |
卖出成本 | 卖出成本 | float | 卖出成本 | 0.0013 | |
因子排序方向 | 因子排序方向 | bool | 因子排序方向 | True | |
是否行业中性化处理 | 是否行业中性化处理 | bool | 是否行业中性化处理,默认已极值和标准化处理 | True | |
是否市值中性化处理 | 是否市值中性化处理 | bool | 是否市值中性化处理 | *必填 | |
是否去除ST股 | 是否去除ST股 | bool | 是否去除ST股 | *必填 | |
是否去除新股 | 是否去除新股 | bool | 是否去除新股 | *必填 | |
是否去除涨跌停股 | 是否去除涨跌停股 | bool | 是否去除涨跌停股 | *必填 | |
基准指数 | 基准指数 | str | 基准指数 | 上证综指 | |
是否作图 | 是否作图 | bool | 是否作图 | True |
#因子分组快速回测 (factor_group__fast_backtest.v2)
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测集模型预测数据 | input_1 | 通用 | 预测集模型预测数据 | *必填 |
预测集代码列表 | input_2 | 通用 | 预测集代码列表 | *必填 | |
输入参数 | rabalance_period | rabalance_period | int | rabalance_period | 21 |
long_port_is_big_factor | long_port_is_big_factor | bool | long_port_is_big_factor | True | |
buy_commission_rate | buy_commission_rate | float | buy_commission_rate | 0.0003 | |
stamp_tax | stamp_tax | float | stamp_tax | 0.001 | |
sell_commission_rate | sell_commission_rate | float | sell_commission_rate | 0.0003 | |
rename_factor | rename_factor | str | rename_factor | score |
#自用因子分组收益 (factor_group_curve.v3)
因子分组收益绘制,需要传入计算的N日收益率DataFrame,根据输入的N截取收益率序列
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测集代码列表 | input_1 | 通用 | 预测集代码列表 | *必填 |
预测数据或因子数据 | input_2 | 通用 | 预测数据或因子数据 | *必填 | |
收益率DataFrame | input_3 | 通用 | 收益率DataFrame | *必填 | |
输入参数 | 指定收益率序列列名 | ret_column | str | 指定收益率序列列名 | ret |
轮仓周期 | N | int | 轮仓周期 | 2 | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#选择因子库因子 (factor_select.v16)
用于因子库的因子选择,可以串接
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 选择因子库因子 | feature | choice | 选择因子库因子 | ['alpha001', 'alpha002', 'alpha003'] |
输出端 | 因子列表 | data | 通用 | 因子列表 |
#测试自用 (factor_test.v3)
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 因子表达式 | factor_str | str | 因子表达式 | -1*market_cap_0 |
decay期数 | decay | int | decay期数 | 3 | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#factor_tob (factor_tob.v1)
开发者: wallstreetcat
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | [4, 6] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 | ||
输出端 | data | data | 通用 |
#因子库数据抽取 (factors_data_extract.v7)
指定证券代码列表和因子列表,抽取指定的因子数据
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | input_1 | 通用 | 证券代码列表 | *必填 |
特征因子列表 | input_2 | 通用 | 特征因子列表 | *必填 | |
输入参数 | DataSource_id | ds_id | str | DataSource_id | 33475194147811e9a0d80a580a8105cf |
输出端 | 因子数据 | data | 通用 | 因子数据 |
#因子库数据 (factors_ds.v3)
因子库数据源,定期更新
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 因子库DataSource_id | ds_id | str | 因子库DataSource_id | 2093cf74081a11e9a1cc0a580a810747 |
起始日期 | start_date | str | 起始日期 | 2018-01-01 | |
结束日期 | end_date | str | 结束日期 | 2018-10-01 | |
输出端 | 因子数据 | data | 通用 | 因子数据 |
#自动特征生成 (fearutre_auto.v2)
利用featuretools工具自动生成因子
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定索引列 | df_unique_id | str | 指定索引列 | date |
指定时间列(可以为空) | time_style_variable_input | str | 指定时间列(可以为空) | date | |
是否输出日志 | verbose_input | bool | 是否输出日志 | True | |
指定内置转换函数(空为全部) | trans_primitives_input | code | 指定内置转换函数(空为全部) | 默认代码 | |
自定义转换函数 | self_transfuns | code | 自定义转换函数 | *必填 | |
指定自定义转换函数列表 | self_transfuns_list | code | 指定自定义转换函数列表 | 默认代码 | |
最大生成的函数深度 | max_depth_input | int | 最大生成的函数深度 | 2 | |
设置并行数量 | njobs_input | int | 设置并行数量 | 1 | |
输出端 | 输出特征数据 | data_1 | 通用 | 输出特征数据 | |
输出特征列表 | data_2 | 通用 | 输出特征列表 |
#特征列表叠加 (features_add.v1)
两个特征列表叠加,并处理为简称
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征列表1 | input_1 | 通用 | 特征列表1 | *必填 |
特征列表2 | input_2 | 通用 | 特征列表2 | *必填 | |
输出端 | 输出特征列表 | data_1 | 通用 | 输出特征列表 |
#特征列表叠加 (features_append.v1)
两个特征列表叠加,并处理为简称(因为特征表达式中可能有"==",先取消"="判断,未避免误判)
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征列表1 | input_1 | 通用 | 特征列表1 | *必填 |
特征列表2 | input_2 | 通用 | 特征列表2 | *必填 | |
输出端 | 输出特征列表 | data_1 | 通用 | 输出特征列表 |
#特征列表因子简称 (features_short.v1)
获取特征列表中的简称构建新的特征列表
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征列表 | input_1 | 通用 | 特征列表 | *必填 |
输出端 | 输出简称特征列表 | data_1 | 通用 | 输出简称特征列表 |
#自动特征组合 (featuretools.v1)
根据所选方法和自定义方法实现自动特征组合
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_df | 通用 | 输入数据 | *必填 |
输入参数 | 唯一索引字段 | df_unique_id | str | 唯一索引字段 | date |
时间类型字段若不表明 | time_style_variable_input | str | 时间类型字段若不表明,则按文本处理 | date | |
选择内置函数 | get_self_transfuns_list_code | code | 选择内置函数 | 默认代码 | |
自定义基础函数 | user_defined_transfuns_code | code | 自定义基础函数 | 默认代码 | |
自定义基础函数列表 | get_user_defined_transfuns_list_code | code | 自定义基础函数列表 | 默认代码 | |
特征公式最大深度 | max_depth_input | int | 特征公式最大深度 | 2 | |
是否输出日志 | verbose_input | bool | 是否输出日志 | True | |
输出端 | 特征数据 | data_1 | 通用 | 特征数据 | |
特征列表 | data_2 | 通用 | 特征列表 |
#fenzuhuice (fenzuhuice.v1)
开发者: xqh980221
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征 | input_1 | 通用 | 特征 | *必填 |
代码 | input_2 | 通用 | 代码 | *必填 | |
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#fetch_close_price (fetch_close_price.v3)
开发者: upton1919
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输出端 | data_1 | data_1 | 通用 | data_1 |
#缺失值填充 (fill_nan.v8)
对缺失值进行分组填充处理
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
特征因子列表 | input_2 | 通用 | 特征因子列表 | *必填 | |
输入参数 | 指定填充的列 | columns_input | code | 指定填充的列 | 默认代码 |
指定分组key列 | group_key | code | 指定分组key列 | 默认代码 | |
指定填充类型 | method | choice | 指定填充类型 | 向下向上填充 | |
指定填充值 | fillnum | float | 指定填充值 | 0.0 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#填充行 (fill_rows.v1)
对于整行数据缺失,此模块按照线性模型填充空行数据。
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#选取指定概念板块股 (filter_concept.v4)
过滤选取指定的概念股
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定概念板块 | concept_str | str | 指定概念板块,例如:人工智能 | 人工智能;大飞机 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#按概念过滤股票 (filter_concepts.v2)
模糊过滤选取指定的概念股
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定概念板块 | concept_str | str | 指定概念板块,例如:人工智能 | 医疗;5G |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#去除退市股 (filter_delist_stock.v6)
过滤去除退市股
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#过滤退市或即将退市股票 (filter_delist_stocks.v3)
过滤退市或即将退市股票
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输出端 | data | data | 通用 |
#用预测过滤股票代码 (filter_instruments_with_predictions.v3)
使用预测结果过滤股票代码,可以减少回测需要加载的股票数据数量。此模块只在回测模式有效。在模拟交易中,不会做任何操作
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | instrument_ds | instrument_ds | 通用 | *必填 | |
prediction_ds | prediction_ds | 通用 | *必填 | ||
输入参数 | 预测结果数 | count | int | 预测结果数,取每天的预测结果数量,0表示所有 | 5 |
输出端 | data_1 | data_1 | 通用 |
#filter_out_markets (filter_out_markets.v1)
开发者: lsj1996
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#股票代码起始过滤 (filter_stockcode.v2)
按股票起始代码过滤,如过滤除去创业板则输入3,科创板输入688
开发者: anzaixiu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 股票市场起始代码 | start | str | 股票市场起始代码,如过滤去除创业板股票则填入3,去除科创板股票则填入688 | 688 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#过滤市场 (filter_stockmarket.v2)
按股票起始代码过滤,如过滤除去创业板则输入3
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 股票市场起始代码 | start | str | 股票市场起始代码,如过滤去除创业板股票则填入3,去除上海交易所股票则填入6 | 3 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#过滤st股票 (filtet_st_stock.v7)
按股票名称过滤去除st,st,*st股票
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#过滤st股票(旧版数据) (filtet_st_stock_old.v4)
按股票名称过滤去除st,st,*st股票
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | data | data | 通用 |
#过滤明日st和退市股票 (filtet_st_stock_tomo.v3)
按明日股票名称过滤去除st,*st和退市股票
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#financial_statement_CN_STOCK_A_with_industry_name (financial_statement_CN_STOCK_A_with_industry_name.v1)
将财报数据与行业名字合并
开发者: lpl22
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
输出端 | data_1 | data_1 | 通用 |
#Factor (fu.v2)
开发者: nolamebrand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | input_2 | *必填 | |
输入参数 | start_date | start_date | str | start_date | *必填 |
end_date | end_date | str | end_date | *必填 | |
rabalance_period | rabalance_period | int | rabalance_period | 22 | |
buy_commission_rate | buy_commission_rate | float | buy_commission_rate | 0.0005 | |
sell_commission_rate | sell_commission_rate | float | sell_commission_rate | 0.0005 | |
ic_method | ic_method | str | ic_method | Rank_IC | |
quantile_num | quantile_num | int | quantile_num | 5 | |
is_standardlize | is_standardlize | bool | is_standardlize | True | |
is_winsorize | is_winsorize | bool | is_winsorize | True | |
输出端 | data_1 | data_1 | 通用 | data_1 | |
data_2 | data_2 | 通用 | data_2 |
#因子 (future.v1)
开发者: nolamebrand
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
输入参数 | start_date | start_date | str | 2016-01-01 | |
end_date | end_date | str | 2021-04-30 | ||
rabalance_period | rabalance_period | int | 22 | ||
buy_commission_rate | buy_commission_rate | float | 0.0005 | ||
sell_commission_rate | sell_commission_rate | float | 0.0005 | ||
ic_method | ic_method | str | Rank_IC | ||
quantile_num | quantile_num | int | 5 | ||
is_standardlize | is_standardlize | bool | True | ||
is_winsorize | is_winsorize | bool | True | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#特征自动生成简称 (generate_simple.v2)
自动生成因子简称
开发者: xkk
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征列表 | input_1 | 通用 | 特征列表 | *必填 |
输入参数 | 简称前缀 | yinziqianzhui | str | 简称前缀 | factor |
输出端 | 与特征列表输出一致的数据格式 | data_1 | 通用 | 与特征列表输出一致的数据格式 |
#获取L2数据 (get_L2_tick.v2)
批量获取股票L2数据
开发者: fornewday
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | input_2 | *必填 | |
输入参数 | before_days | before_days | int | before_days | 1 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#获取每日score (get_daily_score.v1)
获取每日score
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | 2019-01-11 | |
end_date | end_date | str | 2019-01-11 | ||
输出端 | data | data | 通用 |
#获取策略历史交易信号 (get_history_orders.v5)
用于获取订阅的策略或自己的策略历史交易信号,需要输入用户名和密码以及策略的id或notebook_id
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | strategy_id | strategy_id | str | 217 | |
username | username | str | itsatest | ||
pwd | pwd | str | pwd | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#get_minbar (get_minbar.v2)
批量获取股票分钟数据
开发者: wicked_code
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
输入参数 | before_days | before_days | int | before_days | 1 |
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#获取订阅策略每日最新交易计划 (get_plan_orders.v6)
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | input_1 | 通用 | 证券代码列表 | *必填 |
输入参数 | 天梯策略id | strategy_id | str | 天梯策略id | 12505 |
用户名 | username | str | 用户名 | username | |
密码 | pwd | str | 密码 | password | |
输出端 | 证券代码列表 | data_1 | 通用 | 证券代码列表 | |
计划下单数据 | data_2 | 通用 | 计划下单数据 |
#get_signal (get_signal.v2)
获取某日交易信号
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | date | date | str | 2018-10-09 | |
输出端 | data_1 | data_1 | 通用 |
#get_transaction_v99 (get_transaction_v99.v8)
获取历史交易详情
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | user | user | str | uname | |
password | password | str | password | password | |
_id | _id | str | _id | 12505 | |
输出端 | data | data | 通用 | data |
#遗传规划模型训练(GP) (gplearn_train.v3)
遗传规划模型训练(GP),所有的交叉/变异概率综合不要超过1.0
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练集数据 | input_1 | 通用 | 训练集数据 | *必填 |
参与训练的因子 | input_2 | 通用 | 参与训练的因子 | *必填 | |
输入参数 | 使用全局(True)/末代(False)表达式 | IS_USE_BEST_GP | bool | 使用全局(True)/末代(False)表达式 | True |
进化代数 | gnrtn | int | 进化代数 | 3 | |
每代种群数量 | ppltn | int | 每代种群数量 | 80 | |
每代最大抽样比例 | max_samples | float | 每代最大抽样比例 | 0.9 | |
适应度函数 | metric | choice | 适应度函数 | mae | |
适应度函数终止条件<= | stopping_criteria | float | 适应度函数终止条件<= | 0.01 | |
表达式树结构最小深度 | init_depth_min | int | 表达式树结构最小深度 | 2 | |
表达式树结构最大深度 | init_depth_max | int | 表达式树结构最大深度 | 6 | |
子树交叉概率 | p_crossover | float | 子树交叉概率 | 0.9 | |
子树剪枝概率 | p_hoist_mutation | float | 子树剪枝概率 | 0.01 | |
节点变异概率 | p_point_mutation | float | 节点变异概率 | 0.05 | |
节点替换概率 | p_point_replace | float | 节点替换概率 | 0.01 | |
子树变异概率 | p_subtree_mutation | float | 子树变异概率 | 0.01 | |
输出端 | GP模型 | data_1 | 通用 | GP模型 | |
训练集数据拟合结果 | data_2 | 通用 | 训练集数据拟合结果 |
#分组合并 (group_and_merge.v1)
先对数据分组(group),然后合并各组(merge)
开发者: omnia
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | group_by_columns | group_by_columns | str | instrument | |
join_by_columns | join_by_columns | str | date | ||
selected_columns | selected_columns | str | close | ||
sort | sort | bool | True | ||
输出端 | data_1 | data_1 | 通用 |
#guolv (guolv.v2)
sss
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#gzx_test (gzx_test.v3)
gzx_test
开发者: adhaha111
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | test | test | code | test | 默认代码 |
#交易中退市股处理 (handle_delist_stock.v1)
退市股每日排序靠后,做到尽量优先卖出退市股,买入时尽量不考虑
开发者: copen
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data | data | 通用 |
#指数增强(模拟交易) (hedge_strategy_explore.v10)
指数增强策略开发
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入特征列表 | input_ds1 | 通用 | 输入特征列表 | *必填 |
输入参数 | 训练集开始日期 | train_start | str | 训练集开始日期 | 2010-01-01 |
训练集结束日期 | train_end | str | 训练集结束日期 | 2015-01-01 | |
验证集开始日期 | test_start | str | 验证集开始日期 | 2016-01-01 | |
验证集结束日期 | test_end | str | 验证集结束日期 | 2018-10-18 | |
换仓周期 | freq | int | 换仓周期 | 1 | |
持仓股数 | stock_count | int | 持仓股数 | 20 | |
个股最大持仓比例 | ratio_max | float | 个股最大持仓比例 | 0.25 | |
仓位配比均匀度 | pos_gradient | int | 仓位配比均匀度 | 0 | |
初始资金 | capital_start | float | 初始资金 | 10000000 | |
训练集股票范围 | market_train | choice | 训练集股票范围 | 中证500 | |
验证集股票范围 | market_test | choice | 验证集股票范围 | 中证500 | |
业绩基准 | benchmark_ins | choice | 业绩基准 | IC0000.CFX | |
输出端 | 回测结果 | data | 通用 | 回测结果 |
#高频因子统计指标 (highfreq_factor_statistical_indicators.v5)
快速计算高频因子各项统计指标
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输出端 | data_1 | data_1 | 通用 | data_1 |
#hist_return_of_industry (hist_return_of_industry.v1)
画出一段时间申万一级行业收益率直方图
开发者: sszy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 计算开始时间 | start_date | str | 计算开始时间 | 2019-01-01 |
计算结束时间 | end_date | str | 计算结束时间 | 2019-03-22 |
#hist_return_of_stockA (hist_return_of_stockA.v2)
画出一段时间内A股个股的收益率直方图
开发者: sszy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 计算的开始时间 | start_date | str | 计算的开始时间 | 2019-01-01 |
计算的结束时间 | end_date | str | 计算的结束时间 | 2019-03-22 |
#hold_days_test_v1 (hold_days_test_v1.v1)
开发者: jasperzm
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | 持仓周期 | N | int | 持仓周期 | 5 |
输出端 | data_1 | data_1 | 通用 |
#huice_xunyou (huice_xunyou.v1)
用来 超参搜索,优化仓位配比
开发者: woshisilvio
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | hold_days | hold_days | int | 2 | |
stock_num | stock_num | int | 5 | ||
max_cash_per_instrument | max_cash_per_instrument | float | 0.2 | ||
输出端 | data_1 | data_1 | 通用 |
#demo (hw.v6)
demo
开发者: goodchinas
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | [4, 6] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 | ||
输出端 | data_1 | data_1 | 通用 | data_1 |
#自定义参数运行 (hyper_graph.v6)
自定义运行,可以在这里重新设置参数,调配运行。可用于超参数调优、滚动训练等场景
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | bq_graph | bq_graph | str | -- | |
run | run | code | 默认代码 | ||
输出端 | data | data | 通用 |
#i扩展时间区间 (i_extend_datetime_interval.v2)
扩展时间区间(按向前取数据天数), 取代基础特征抽取模块的对应选项, 方便动态向前取数据
开发者: chaoskey
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码输入数据 | input_is | 通用 | 证券代码输入数据 | *必填 |
输入参数(含向前取数据天数) | input_params | 通用 | 输入参数(含向前取数据天数) | *必填 | |
输出端 | 证券代码输出数据 | data | 通用 | 证券代码输出数据 |
#i模板数据过滤 (i_filter.v5)
按模板对数据进行过滤 (模板中的{0}{1}.... 参考string.format(...))
开发者: chaoskey
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_ds | 通用 | 输入数据 | *必填 |
模板参数数据(元组) | input_params | 通用 | 模板参数数据(元组) | *必填 | |
输入参数 | 过滤表达式模板 | expr_fmt | str | 过滤表达式模板 | `fu_trade_num_in_{0}()`>{1} |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#i模板特征 (i_template_features.v2)
模板特征(i_template_features), 参考 string.format(...)
开发者: chaoskey
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入特征数据 | input_fs | 通用 | 输入特征数据 | *必填 |
模板参数(元组) | input_params | 通用 | 模板参数(元组) | *必填 | |
输入参数 | 模板特征(用|隔开) | param_fs | str | 模板特征(用|隔开) | "{0}" |
输出端 | 输出特征数据 | data | 通用 | 输出特征数据 |
#i_top (i_top.v9)
按指定列排序, 并取TOP_N
开发者: chaoskey
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_ds | 通用 | 输入数据 | *必填 |
输入参数 | 排序列名 | sort_key | str | 排序列名 | "" |
默认0从大到小 | ascending | int | 默认0从大到小 | 0 | |
TOP_N | top_num | int | TOP_N | 100 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#指数特征抽取 (index_feature_extract.v3)
通过指数日线行情数据抽取因子,因子序号对应输入特征列表的顺序
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | input_1 | 通用 | 证券代码列表 | *必填 |
特征因子列表 | input_2 | 通用 | 特征因子列表 | *必填 | |
输入参数 | 行情数据向前抽取天数 | before_days | int | 行情数据向前抽取天数 | 100 |
指数代码 | index | str | 指数代码 | 000300.HIX | |
输出端 | 特征数据 | data_1 | 通用 | 特征数据 | |
指数因子列表 | data_2 | 通用 | 指数因子列表 |
#指数增强策略 (index_reinforce.v2)
该功能模块主要功能为:在给定的指数成份股中优化选股和仓位以实现指数增强
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入特征列表 | input_ds1 | 通用 | 输入特征列表 | *必填 |
输入参数 | 训练集开始日期 | train_start | str | 训练集开始日期 | 2010-01-01 |
训练集结束日期 | train_end | str | 训练集结束日期 | 2015-01-01 | |
验证集开始日期 | test_start | str | 验证集开始日期 | 2016-01-01 | |
验证集结束日期 | test_end | str | 验证集结束日期 | 2018-10-18 | |
换仓周期 | freq | int | 换仓周期,策略默认定期重新按股票排名换仓 | 1 | |
持仓股数 | stock_count | int | 持仓股数,策略持有的股票个数 | 20 | |
个股最大持仓比例 | ratio_max | float | 个股最大持仓比例,允许的个股最高持股比例 | 0.25 | |
仓位配比均匀度 | pos_gradient | int | 仓位配比均匀度,此项越大个股的持仓比例越均匀 | 0 | |
初始资金 | capital_start | int | 初始资金 | 10000000 | |
训练集股票池范围 | market_train | choice | 训练集股票池范围 | 中证500 | |
验证集股票池范围 | market_test | choice | 验证集股票池范围 | 中证500 | |
业绩基准 | benchmark_ins | choice | 业绩基准 | IC0000.CFX | |
输出端 | 回测结果 | data | 通用 | 回测结果 |
#index_rename (index_rename.v1)
数据以日期为依据升序排列,并索引重命名
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | input_1 | input_1 | int | 1 |
#读取csv文件 (input_csv.v5)
根据需要读取csv文件
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 文件名 | file | str | 文件名 | xxx.csv |
编码类型 | coding | str | 编码类型 | GBK | |
指定字段数据类型 | dtypes | code | 指定字段数据类型 | 默认代码 | |
日期格式 | date_type | str | 日期格式 | %Y%m%d | |
指定日期列名 | date_cols | code | 指定日期列名 | 默认代码 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#代码列表_test (instruments_test.v2)
代码列表_test
开发者: adhaha111
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | start_date | *必填 |
end_date | end_date | str | end_date | *必填 | |
csv_path | csv_path | str | csv_path | *必填 | |
输出端 | data | data | 通用 | data |
#jim_rank_list (jim_rank_list.v1)
获得StockRanker里面股票的排名
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#jim_ready_go (jim_ready_go.v8)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | input_2 | *必填 | |
input_3 | input_3 | 通用 | input_3 | *必填 | |
输入参数 | mark | mark | str | mark | 测试 |
输出端 | mark | data_1 | 通用 | mark |
#label_del_inf (label_del_inf.v1)
开发者: mefan
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#罗伯特预测数据 (lbtgj_pred.v2)
开发者: whitebear
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | model_id | model_id | str | model_id | 3c1300e609db42c9a552952af81a6438T |
start_date | start_date | str | start_date | 2020-01-01 | |
end_date | end_date | str | end_date | 2020-10-01 | |
输出端 | data_1 | data_1 | 通用 | data_1 |
#lightgbm_predict (lightgbm_predict.v2)
开发者: mafamily2496
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | model | model | 通用 | *必填 | |
features | features | 通用 | *必填 | ||
data | data | 通用 | *必填 | ||
输出端 | predictions | predictions | 通用 |
#lightgbm_train (lightgbm_train.v1)
开发者: mafamily2496
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | data | data | 通用 | *必填 | |
features | features | 通用 | *必填 | ||
输出端 | model | model | 通用 |
#lightgbm_v2 (lightgbm_v2.v1)
V2版LightGBM,增加迭代次数参数
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 | ||
input_3 | input_3 | 通用 | *必填 | ||
输入参数 | objective | objective | str | lambdarank | |
num_leaves | num_leaves | int | 30 | ||
learning_rate | learning_rate | float | 0.1 | ||
max_bin | max_bin | int | 255 | ||
min_data_in_leaf | min_data_in_leaf | int | 200 | ||
num_boost_round | num_boost_round | int | 30 | ||
n_jobs | n_jobs | int | 4 | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 | |||
data_3 | data_3 | 通用 |
#显示线性回归系数 (linear_regression_coef.v1)
显示线性回归截距和系数
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | factor | factor | str | factor1 |
#列表式输入特征 (list_input_feature.v11)
列表方式输入特征
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入特征 | input_features | 通用 | 输入特征 | *必填 |
输入参数 | 输入特征列表 | feature_list | code | 输入特征列表 | 默认代码 |
输出端 | 输出特征列表 | feature_list | 通用 | 输出特征列表 |
#列表转换维度 (list_shape.v1)
把列表(list)转换为np.array()带维度的形式
开发者: blsn
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#对date以外的列取对数 (log.v2)
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | date_1 | date_1 | 通用 |
#logistic_model (logistic_model.v2)
逻辑斯蒂回归
开发者: feynman0825
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | input_1 | 通用 | 训练数据 | *必填 |
特征列表 | input_2 | 通用 | 特征列表 | *必填 | |
预测数据 | input_3 | 通用 | 预测数据 | *必填 | |
输入参数 | penalty | penalty | str | l2 | |
C | C | float | 0.1 | ||
输出端 | 预测值 | data_1 | 通用 | 预测值 |
#m4_min_self (m4_min_self.v1)
开发者: ljh
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | before_days | before_days | int | 1 |
#mark_input (mark_input.v6)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | mark | mark | str | mark | 测试 |
输出端 | data_1 | data_1 | 通用 | data_1 |
#最大回撤参数 (max_downdraw.v1)
设置最大回撤和最大反弹参数
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | max_downdraw | max_downdraw | float | -0.1 | |
max_updraw | max_updraw | float | 0.1 | ||
输出端 | data_1 | data_1 | 通用 |
#model_dir (model_dir.v1)
开发者: james_3
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | model_dir | model_dir | code | 默认代码 | |
输出端 | data_1 | data_1 | 通用 |
#模型读取(深度学习) (model_read.v1)
用于从指定路径读取指定名称的的模型文件,便于模拟交易的模型固化
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 文件路径 | filedir | str | 文件路径 | /home/bigquant/work/userlib/ |
文件名称 | filename | str | 文件名称 | test | |
输出端 | 模型数据 | data | 通用 | 模型数据 |
#模型保存(深度学习) (model_save.v1)
将训练后的模型保存到指定文件夹,如果文件名为空默认文件名为最新保存的时间。
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | 模型文件保存的路径地址 | filedir | str | 模型文件保存的路径地址 | /home/bigquant/work/userlib/ |
文件名称 | filename | str | 文件名称 | test |
#多策略组合 (multi_strategy_combine.v1)
设置多策略初始固定权重分配,根据回测模块的raw_perf地址,对回测结果进行组合。
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | input_1 | 通用 | 代码列表 | *必填 |
输入参数 | 多策略回测模块raw_perf地址 | DataSource_list | code | 多策略回测模块raw_perf地址 | 默认代码 |
多策略初始分配权重 | ratio_list | code | 多策略初始分配权重 | 默认代码 | |
回测开始日期 | start_date | str | 回测开始日期 | 2019-01-01 | |
回测结束日期 | end_date | str | 回测结束日期 | 2019-12-31 | |
指数代码 | index | str | 指数代码 | 000300.HIX | |
输出端 | 多策略收益数据 | data_1 | 通用 | 多策略收益数据 | |
多策略订单数据 | data_2 | 通用 | 多策略订单数据 |
#my_conv1d (my_conv1d.v1)
开发者: justforfun235
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#my_test (my_test.v15)
my_test
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始时间 | 开始时间 | str | 开始时间 | 2015-01-01 |
结束时间 | 结束时间 | str | 结束时间 | 2019-01-01 | |
股票池 | 股票池 | choice | 股票池 | 全市场 | |
因子或因子表达式 | 因子或因子表达式 | str | 因子或因子表达式 | pe_ttm_0 | |
调仓周期 | 调仓周期 | int | 调仓周期 | 22 | |
买入成本 | 买入成本 | float | 买入成本 | 0.0003 | |
卖出成本 | 卖出成本 | float | 卖出成本 | 0.0013 | |
因子排序方向 | 因子排序方向 | bool | 因子排序方向 | True | |
是否行业中性化处理 | 是否行业中性化处理 | bool | 是否行业中性化处理 | *必填 | |
是否去除ST股 | 是否去除ST股 | bool | 是否去除ST股 | *必填 | |
是否去除新股 | 是否去除新股 | bool | 是否去除新股 | *必填 | |
是否去除涨跌停股 | 是否去除涨跌停股 | bool | 是否去除涨跌停股 | *必填 | |
是否作图 | 是否作图 | bool | 是否作图 | True | |
图表输出 | 图表输出 | choice | 图表输出 | ['全部'] |
#缺失值及无穷值处理 (nan_inf.v2)
缺失值nan及无穷值inf处理:用 np.nan_to_num 自适应替换 inf 为对应数据类型的最大有限数,同时替换 NaN 为0。
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input | input | 通用 | *必填 | |
输出端 | data | data | 通用 |
#neutral (neutral.v1)
数据中性化处理
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | 因子名 | columns | str | 因子名 | "market_cap_0" |
是否市值中性化 | market_cap_n | str | 是否市值中性化 | 0 | |
是否行业中性化 | ind_n | str | 是否行业中性化 | 0 | |
输出端 | data_1 | data_1 | 通用 |
#中性化处理 (neutralize.v12)
截面数据中性化,可以选择行业中性化或者行业和市值同时中性化
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入特征列表 | input_2 | 通用 | 输入特征列表 | *必填 | |
输入参数 | 指定行业中性化的列 | columns_input | code | 指定行业中性化的列 | 默认代码 |
是否同时市值中性化 | market_value_key | bool | 是否同时市值中性化 | True | |
是否输出行业哑变量 | industry_output_key | bool | 是否输出行业哑变量 | True | |
市值因子列名 | market_col_name | str | 市值因子列名 | market_cap_float_0 | |
行业因子列名 | industry_sw_col_name | str | 行业因子列名 | industry_sw_level1_0 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#norm (norm.v1)
开发者: jh0924
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#独热编码 (one_hot.v7)
股票自动标注后,添加独热编码<one_hot>,并且删除自动标注多余的列。
开发者: blsn
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 标注数据 | input_data | 通用 | 标注数据 | *必填 |
输入参数 | 是否添加独热编码 | one_hot | bool | 是否添加独热编码 | *必填 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#指定因子独热编码 (one_hot_Copy.v2)
添加独热编码<one_hot>,目前一次只支持一个因子。
开发者: qq360725038
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 标注数据 | input_data | 通用 | 标注数据 | *必填 |
单个因子特征列表 | one_hot_feature_list | 通用 | 单个因子特征列表 | *必填 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#当日开盘除以昨日收盘 (openvsclose.v2)
开发者: zhrh888
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#回测寻优参数配置 (optimize_backtest.v3)
用于并行优化时回测模块的参数配置
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测数据 | input_1 | 通用 | 预测数据 | *必填 |
输入参数 | 资金轮仓周期 | hold_days | int | 资金轮仓周期 | 2 |
股票数量 | stock_num | int | 股票数量 | 5 | |
单票最大仓位限制 | max_cash_per_instrument | float | 单票最大仓位限制 | 0.2 | |
输出端 | 回测参数字典 | data_1 | 通用 | 回测参数字典 |
#优化器每日持仓占比展示 (optimizer_daily_pos_plot.v3)
优化器每日持仓占比展示,该模块配合"经典组合优化器"模块一起使用,是其下游模块。
开发者: outside
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 经典组合优化器的输出 | input_1 | 通用 | 经典组合优化器的输出 | *必填 |
输出端 | 经典组合优化器优化出的仓位权重 | data_1 | 通用 | 经典组合优化器优化出的仓位权重 |
#option_para (option_para.v2)
提供额外参数项,便于自定义运行模块
开发者: wallstreetcat
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | stock_num | stock_num | str | 5 | |
hold_days | hold_days | str | 5 | ||
other_para | other_para | str | [object Object] | ||
输出端 | data_1 | data_1 | 通用 |
#成交单回测 (order_record_backtest.v6)
成交单回测模块
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | input_1 | 通用 | 证券代码列表 | *必填 |
成交数据 | input_2 | 通用 | 成交数据 | *必填 | |
输入参数 | 初始资金 | start_capital | float | 初始资金 | 100000000 |
输出端 | 回测结果 | data_1 | 通用 | 回测结果 |
#正交化 (orthogonalize.v9)
因子(特征)数据正交化,包括施密特正交化Schmidt和对称正交化Symmetry
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 待正交化特征数据 | feature_data | 通用 | 待正交化特征数据 | *必填 |
待正交化特征列表 | feature_list | 通用 | 待正交化特征列表 | *必填 | |
输入参数 | 正交方式 | orthkind | choice | 正交方式 | *必填 |
输出端 | 已正交化特征数据 | data_1 | 通用 | 已正交化特征数据 | |
已正交化特征列表 | data_2 | 通用 | 已正交化特征列表 |
#Pandas透视表 (pandas_pivot_table.v1)
pandas.pivot_table透视表封装
开发者: ingeno
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_data | 通用 | 输入数据 | *必填 |
输入参数 | index | index | str | index,对应pivot_table的参数index | date |
columns | columns | str | columns,对应pivot_table的参数columns,多个列名用英文逗号分隔 | instrument | |
values | values | str | values,对应pivot_table的参数values,多个列名用英文逗号分隔 | *必填 | |
flat | flat | bool | flat,如果是MultiIndex列,是否将列平面化 | *必填 | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#参数循环 (param_define.v1)
合并预测结果和参数
开发者: kobe
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入预测结果 | input_1 | 通用 | 输入预测结果 | *必填 |
输入参数 | 股票只数 | stock_num | int | 股票只数 | 10 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#参数字典自定义 (param_dict_def.v1)
用于参数字典的自定义
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 自定义参数字典 | params | code | 自定义参数字典 | 默认代码 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#params (params.v7)
开发者: xry
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
input_2 | input_2 | 通用 | *必填 | ||
input_3 | input_3 | 通用 | *必填 | ||
input_4 | input_4 | 通用 | *必填 | ||
input_5 | input_5 | 通用 | *必填 | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 |
#自定义参数特征列表 (params_feature_list.v12)
支持自定义参数的特征列表
开发者: kobe
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入特征列表 | input_1 | 通用 | 输入特征列表 | *必填 |
输入参数 | 参数替换字典定义 | params | code | 参数替换字典定义 | 默认代码 |
输出端 | 输出特征列表 | data | 通用 | 输出特征列表 |
#performance_analysis (performance_analysis.v1)
开发者: feynman0825
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 |
#周期转换 (period_resample.v1)
开发者: hxjj001
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 转换周期 | resample_period | str | 转换周期 | M |
转换方式 | how_key | str | 转换方式 | last | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#透视表填充处理 (pivot_fbfill_stack.v3)
对指定DataFrame进行透视表转化然后执行向后填充、向前填充后stack,常用于收益率的计算
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 透视表索引列名 | index_col | str | 透视表索引列名 | date |
透视表列名 | col_name | str | 透视表列名 | instrument | |
透视表值列名 | values_col | str | 透视表值列名 | close_0 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#plot (plot.v1)
开发者: user254
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 单个股票 | ins | 通用 | 单个股票 | *必填 |
开始日期 | start_date | 通用 | 开始日期 | *必填 | |
结束日期 | end_date | 通用 | 结束日期 | *必填 | |
特征列表 | features | 通用 | 特征列表 | *必填 |
#绘制T.plot (plot_df.v7)
T.plot一个简单封装
开发者: omnia
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | x | x | str | date | |
y | y | str | -- | ||
title | title | str | 标题 | ||
chart_type | chart_type | str | line | ||
options | options | code | 默认代码 |
#绘制策略收益曲线 (plot_strategy_pnl_curve.v1)
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | strategy_id | strategy_id | str | *必填 | |
user | user | str | *必填 | ||
password | password | str | *必填 | ||
benchmark | benchmark | str | 沪深300指数 |
#portfolio_optimize (portfolio_optimize.v1)
仓位组合优化测试
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 股票池 | input_ds1 | 通用 | 股票池 | *必填 |
特征因子 | input_ds2 | 通用 | 特征因子 | *必填 | |
输入参数 | 训练集起始日期 | train_start | str | 训练集起始日期 | 2010-01-01 |
训练集终止日期 | train_end | str | 训练集终止日期 | 2015-01-01 | |
测试集起始日期 | test_start | str | 测试集起始日期 | 2015-01-01 | |
测试集终止日期 | test_end | str | 测试集终止日期 | 2018-09-20 | |
调仓周期 | freq | str | 调仓周期 | 22 | |
单只个股最大仓位占比 | ratio_max | str | 单只个股最大仓位占比 | 0.4 | |
初始资金 | capital_start | str | 初始资金 | 1000000 | |
输出端 | data | data | 通用 |
#portfolio_optimizer (portfolio_optimizer.v9)
组合优化器
开发者: feynman0825
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | obj_type | obj_type | str | risk_reverse | |
cost_model | cost_model | str | *必填 | ||
gamma | gamma | str | 0.1 | ||
lam | lam | str | 10000 | ||
theta | theta | str | 0.003 | ||
mu | mu | str | 4cb45466d1f111e897340a580a81048c | ||
cov | cov | str | f206895ed1ef11e897340a580a81048c | ||
w_prev | w_prev | str | *必填 | ||
long_only | long_only | str | True | ||
holding_constraint | holding_constraint | str | 0.0,0.2 |
#prediction_set_accuracy (prediction_set_accuracy.v1)
计算预测集准确率
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#print_len_of_train (print_len_of_train.v2)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
input_2 | input_2 | 通用 | *必填 |
#printtime (printtime.v1)
开发者: itsatest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#process_data (process_data.v5)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 | data_1 |
#process_data_batch (process_data_batch.v1)
开发者: james_5
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 |
#process_data (process_data_bn.v1)
开发者: james_5
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 | data_1 |
#process_data_dense (process_data_dense.v1)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 | data_1 |
#将0值转为nan (put_0_to_nan.v2)
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#pyfolio_full_tear_sheet (pyfolio_full_tear_sheet.v1)
策略风险分析是对整个策略回测以后进行风险分析,主要包括:
回测相关指标,比如年化收益、收益波动率、夏普比率、最大回撤、偏度、峰度、索提纳比率、信息比率、贝塔、阿尔法
最大的前五次回撤,包括回撤时间段、回撤幅度、回撤天数
日收益折线图
月度收益率、年度收益率、月度收益分布图
日收益茎叶图、周收益茎叶图、年收益茎叶图
盈利最大前10股票
多头市值与空头市值
每日持仓股票数、每日杠杆、每日换手率、每日交易额
开发者: wicked_code
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#策略风险分析 (pyfolio_full_tear_sheet1.v1)
策略风险分析是对整个策略回测以后进行风险分析,主要包括:
回测相关指标,比如年化收益、收益波动率、夏普比率、最大回撤、偏度、峰度、索提纳比率、信息比率、贝塔、阿尔法
最大的前五次回撤,包括回撤时间段、回撤幅度、回撤天数
日收益折线图
月度收益率、年度收益率、月度收益分布图
日收益茎叶图、周收益茎叶图、年收益茎叶图
盈利最大前10股票
多头市值与空头市值
每日持仓股票数、每日杠杆、每日换手率、每日交易额
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#pytest123 (pytest123.v1)
开发者: pengyue111
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#pytestsssss (pytestsssss.v1)
开发者: pengyue111
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#rate (rate.v1)
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#read_csv (read_csv.v10)
开发者: muhai123
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#read_data (read_data.v1)
从历史数据中读取基础数据
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#读取主力合约行情 (read_dominant_md.v5)
开发者: bigrzz
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 代码列表 | input_1 | 通用 | 代码列表 | *必填 |
输入参数 | frequency | frequency | choice | daily | |
输出端 | data_1 | data_1 | 通用 | data_1 |
#读取定制数据 (read_specical_data.v2)
读取定制数据
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | 2019-01-01 | |
end_date | end_date | str | 2019-12-31 | ||
文件名 | filename | str | 文件名 | factors_df.h5 | |
KEY | key | str | KEY | df | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#股票轮仓信号读入 (read_stocklist.v1)
读入股票持仓信息,包含日期和和股票代码两列数据。
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 股票轮仓信号文件名 | filename | str | 股票轮仓信号文件名 | stocklist.csv |
文件编码方式 | code | str | 文件编码方式 | utf-8 | |
输出端 | 每日股票持仓 | data_1 | 通用 | 每日股票持仓 |
#缩减存储占用 (reduce_mem_usage.v2)
判断和转换输入 df 的列类型,缩减存储占用。输入 df 需要先行处理 nan 和 inf。
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input | input | 通用 | *必填 | |
输出端 | data | data | 通用 |
#remove_Second_board (remove_Second_board.v1)
去掉创业板股票
开发者: yjc6296
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#修改列名 (rename_columns.v5)
修改数据列名
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | 列名映射 | columns | str | 列名映射,格式为:原列名1:新列名1|原列名2:新列名2|原列名3:新列名3|.. | *必填 |
是否保留原列 | keep_old_columns | bool | 是否保留原列 | True | |
输出端 | data | data | 通用 |
#修改列名@ (rename_columns1.v1)
列名映射
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据源 | input_ds | 通用 | 输入数据源 | *必填 |
输入参数 | 旧列名1@新列名1|旧列名2@新列名2 | columns | str | 旧列名1@新列名1|旧列名2@新列名2 | deal_numbe@new_deal_number|close@new_close |
keep_old_columns | keep_old_columns | bool | True | ||
输出端 | 输出数据 | data | 通用 | 输出数据 |
#特征因子列表长表达式处理 (renamefactors.v1)
特征因子列表长表达式改名为facXXX
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征因子列表 | input_1 | 通用 | 特征因子列表 | *必填 |
输出端 | 短因子列表 | data_1 | 通用 | 短因子列表 | |
列名字典 | data_2 | 通用 | 列名字典 |
#无穷大异常数据处理 (replace_inf_dropna.v1)
将正负无穷大数据替换为Nan并drop去除
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#周期转换 (resample_df.v15)
根据需要将历史日线行情数据转换周线(W-FRI)、月线(M)
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入日线行情数据 | input_1 | 通用 | 输入日线行情数据 | *必填 |
输入参数 | 转换的列名 | columns | code | 转换的列名 | 默认代码 |
转换频率 | resample_period | str | 转换频率 | M | |
处理方式 | how_key | code | 处理方式 | 默认代码 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#周期转换 (resample_df_Copy.v1)
根据需要将历史日线行情数据转换周线(W-FRI)、月线(M)
开发者: jyq123
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入日线行情数据 | input_1 | 通用 | 输入日线行情数据 | *必填 |
输入参数 | 转换的列名 | columns | code | 转换的列名 | 默认代码 |
转换频率 | resample_period | str | 转换频率 | M | |
处理方式 | how_key | code | 处理方式 | 默认代码 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#删除原索引,重建索引 (reset_index_drop.v1)
reset_index(drop=True),输入端连1,输出端连1
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#策略收益与风险分析 (revenue_risk_analysis.v2)
对策略采用市场大类因子进行收益与风险归因
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测结果数据 | input_1 | 通用 | 回测结果数据 | *必填 |
#reverse_cal (reverse_cal.v1)
开发者: yunisa12
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | N | N | int | 20 | |
输出端 | data_1 | data_1 | 通用 |
#rr44 (rr44.v1)
rr44
开发者: wintersp
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param1 | param1 | int | 2 |
#rrr111 (rrr111.v1)
rrr111
开发者: royshu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#rydeng (rydeng.v30)
开发者: rydeng
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | k | k | int | k | 20 |
mm | mm | str | mm | ["2"] | |
sss | sss | str | sss | ||
输出端 | data_1 | data_1 | 通用 | data_1 |
#选择列 (select_columns.v3)
选择需要的列
开发者: jliang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_ds | 通用 | 输入数据 | *必填 |
输入列 | columns_ds | 通用 | 输入列,将与参数的输入列合并 | *必填 | |
输入参数 | 输入列 | columns | str | 输入列,将与输入端的输入列合并。多个列用英文逗号分隔,例如 open,close | *必填 |
反选 | reverse_select | bool | 反选,即删除选中的列 | *必填 | |
输出端 | data | data | 通用 |
#K特征选择 (select_k_best.v9)
选择K个最佳特征
开发者: ljj13802239795
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始日期 | start_date | str | 开始日期 | 2005-01-01 |
结束日期 | end_date | str | 结束日期 | 2015-01-01 | |
评分函数(f_classif/chi2) | score_func | choice | 评分函数(f_classif/chi2) | *必填 | |
拟选特征个数k | k | int | 拟选特征个数k | 60 | |
是否在屏幕输出结果? | if_print | bool | 是否在屏幕输出结果? | True | |
源特征列表 | feature_list | code | 源特征列表 | 默认代码 | |
输出端 | 最佳特征列表 | data_1 | 通用 | 最佳特征列表 | |
scores&pvalues | data_2 | 通用 | scores&pvalues |
#self_portfolio_optimize (self_portfolio_optimize.v6)
自有股票仓位优化
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | input_ds1 | 通用 | 证券代码列表 | *必填 |
特征因子列表 | input_ds2 | 通用 | 特征因子列表 | *必填 | |
输入参数 | 训练集起始日期 | train_start | str | 训练集起始日期 | 2010-01-01 |
训练集结束日期 | train_end | str | 训练集结束日期 | 2015-01-01 | |
验证集起始日期 | test_start | str | 验证集起始日期 | 2015-01-01 | |
验证集结束日期 | test_end | str | 验证集结束日期 | 2018-09-20 | |
换仓周期 | freq | int | 换仓周期 | 5 | |
持股数量 | stock_count | int | 持股数量 | 20 | |
最大个股持仓比例 | ratio_max | float | 最大个股持仓比例 | 0.3 | |
仓位分配均匀度 | pos_gradient | int | 仓位分配均匀度 | 0 | |
初始资金 | capital_start | float | 初始资金 | 10000000 | |
业绩基准 | bm | str | 业绩基准 | 000300.SHA |
#设'date'为index (set_index.v1)
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#设inf为nan (set_inf_to_nan.v1)
把所有inf设为nan
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#shu_FactorAnalysis (shu_FactorAnalysis.v12)
shu_FactorAnalysis2
开发者: wintersp
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | data_start | data_start | str | data_start | 2020-01-01 |
data_end | data_end | str | data_end | 2020-03-20 | |
features | features | code | features | 默认代码 | |
before_days | before_days | int | before_days | 1000 | |
list_days | list_days | int | list_days | 60 | |
pre_process | pre_process | code | pre_process | 默认代码 | |
cond_feature | cond_feature | code | cond_feature | 默认代码 | |
exclude_stock_list | exclude_stock_list | code | exclude_stock_list | 默认代码 | |
ret_feature | ret_feature | code | ret_feature | 默认代码 | |
bench_ret_feature | bench_ret_feature | code | bench_ret_feature | 默认代码 | |
benchmark | benchmark | str | benchmark | *必填 | |
factor_names | factor_names | code | factor_names | 默认代码 | |
输出端 | data_1 | data_1 | 通用 | data_1 |
#shu_t1 (shu_t1.v2)
shu_t1
开发者: wintersp
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | data_start | data_start | str | 2020-03-01 | |
ss | ss | code | 默认代码 |
#single_analysis (single_analysis.v1)
factor:
start_time:
end_time:
if_market:
if_industry:
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#single_analysis_0718 (single_analysis_0718.v1)
N是换仓周期
is_industry:是否行业中性化
is_market:是否市值中性化
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | factor | factor | str | -1*ts_rank(rank(low_0),9) | |
N | N | int | 20 | ||
is_industry | is_industry | bool | True | ||
is_market | is_market | bool | *必填 | ||
start_date | start_date | str | 2018-01-01 | ||
end_date | end_date | str | 2018-12-31 | ||
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 | |||
data_3 | data_3 | 通用 |
#single_stock_read (single_stock_read.v1)
single_stock_read
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | ins | ins | str | 000001.SZA |
#single_variable (single_variable.v2)
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#smartisan (smartisan.v2)
开发者: art
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | opts | opts | code | *必填 |
#绘制分组分布图 (sns_catplot.v1)
封装seaborns库中的分组分布图绘制,可对输入的DataFrame指定的x轴和y轴两列数据绘制盒式图、小提琴图、散点图等多种类型数据分布并分组展示。
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定X轴数据列名 | x | str | 指定X轴数据列名 | *必填 |
指定Y轴数据列名 | y | str | 指定Y轴数据列名 | *必填 | |
图展示类型 | kind | choice | 图展示类型 | s | |
指定分组列名 | hue | code | 指定分组列名 | 默认代码 | |
图幅尺寸 | size | int | 图幅尺寸 | 5 |
#绘制单变量直方图 (sns_displot.v1)
seaborn_displot封装,绘制输入DataFrame的指定列直方图和概率密度
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定绘制的列名 | x | str | 指定绘制的列名 | fs_roe_0 |
是否绘制概率密度分布 | kde | bool | 是否绘制概率密度分布 | *必填 | |
分组数量 | bins | int | 分组数量 | 100 |
#绘制双变量联合分布 (sns_jointplot.v2)
封装seaborn jointplot函数,绘制输入DataFrame中指定的两列变量的联合分布
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定变量1的列名 | x | str | 指定变量1的列名 | fs_roe_0 |
指定变量2的列名 | y | str | 指定变量2的列名 | fs_roa_ttm_0 | |
指定绘图类型 | kind | choice | 指定绘图类型 | s |
#绘制多变量联合分布组图 (sns_pairgrid.v3)
封装seaborn pairgrid函数,绘制输入DataFrame中指定的列变量之间的两两联合分布组图
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入需要绘制的特征列表 | input_2 | 通用 | 输入需要绘制的特征列表 | *必填 | |
输入参数 | 对角线图类型 | map_diag | choice | 对角线图类型 | k |
上三角图类型 | map_upper | choice | 上三角图类型 | s | |
下三角图类型 | map_lower | choice | 下三角图类型 | s |
#sort_self (sort_self.v1)
开发者: lylelai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#sst_0924_v2 (sst_0924.v2)
开发者: wallstreetcat
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | factor | *必填 |
输入参数 | window | window | int | window | 5 |
buy_sel_rank | buy_sel_rank | choice | buy_sel_rank | [4, 6] | |
field | field | str | field | gxl | |
asc | asc | bool | asc | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#sst_0924_v3 (sst_0924_v3.v1)
开发者: wallstreetcat
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 4 | |
buy_sel_rank | buy_sel_rank | choice | [4, 6] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 | ||
输出端 | data_1 | data_1 | 通用 |
#sst_demo (sst_demo.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | a | a | 通用 | *必填 | |
b | b | 通用 | *必填 | ||
输入参数 | { | { | int | *必填 | |
int | *必填 | ||||
输出端 | data_1 | data_1 | 通用 |
#sst_read_table (sst_read_table.v1)
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#优化标准化模块 (stand_standardlize.v15)
开发者: bigrzz
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 待标准化的数据 | data_to_standardlize | 通用 | 待标准化的数据 | *必填 |
因子列表 | features | 通用 | 因子列表 | *必填 | |
数据分布 | data_dis | 通用 | 数据分布 | *必填 | |
direction | direction | 通用 | *必填 | ||
输出端 | 标准化后的数据 | data_output | 通用 | 标准化后的数据 | |
数据分布 | data_dis | 通用 | 数据分布 |
#standardize_series (standardize_series.v1)
开发者: upton1919
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#stock_univ_sort_by_day (stock_univ_sort_by_day.v4)
根据逐日的股票池数据,筛选因子数据.
开发者: woodman2019
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | csv文件地址 | path | str | csv文件地址 | univ_date_2006_2019.csv |
输出端 | 筛选后的数据 | data_1 | 通用 | 筛选后的数据 |
#股票池单因子分组测试 (stockpool_singlefactor_analysis.v1)
给定股票池文件csv,date和instrument, 按照给定因子分组等权重回测。
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 指定因子表达式 | feature_input | str | 指定因子表达式 | return_20 |
指定结束日期 | end | str | 指定结束日期 | 2019-03-01 | |
指定csv文件名 | filename | str | 指定csv文件名 | stocklist1.csv | |
编码格式 | code | str | 编码格式 | utf-8 |
#stockranker_return (stockranker_return.v8)
通过stockranker预测出的TOP5股票,绘出其累计收益率曲线
开发者: xysgs
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | stockranker预测结果 | input_1 | 通用 | stockranker预测结果 | *必填 |
当日收益率数据 | input_2 | 通用 | 当日收益率数据 | *必填 | |
输出端 | 全部收益率数据 | data_1 | 通用 | 全部收益率数据 |
#将日期字符串转为datetime格式 (str_to_date_time.v1)
将日期字符串'2009-01-03 01:00:00'转为datetime格式
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#策略的超额收益指标计算 (strategy_excess_performane.v2)
策略的超额收益指标计算
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#单字符串转为列表 (string_list.v1)
输入字符串,输出列表list
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | string | string | str | BTCUSD |
#滚动运行配置 (summertest003.v1)
滚动运行配置。返回滚动列表,每个滚动包含开始日期和结束日期。
开发者: summercs4
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始日期 | start_date | str | 开始日期 | 2010-01-01 |
结束日期 | end_date | str | 结束日期 | 2015-12-31 | |
更新周期 | rolling_update_days | int | 更新周期,按自然日计算,每多少天更新一次 | 365 | |
模拟实盘更新周期 | rolling_update_days_for_live | int | 模拟实盘更新周期,按自然日计算,每多少天更新一次。如果需要在模拟实盘阶段使用不同的模型更新周期,可以设置这个参数 | *必填 | |
最小数据天数 | rolling_min_days | int | 最小数据天数,按自然日计算,所以第一个滚动的结束日期是 从开始日期到开始日期+最小数据天数 | 730 | |
最大数据天数 | rolling_max_days | int | 最大数据天数,按自然日计算,0,表示没有限制,否则每一个滚动的开始日期=max(此滚动的结束日期-最大数据天数, 开始日期) | *必填 | |
实盘滚动次数 | rolling_count_for_live | int | 实盘滚动次数,模拟实盘模式下,取最后多少次滚动。一般在模拟实盘模式下,只用到最后一次滚动训练的模型,这里可以设置为1;如果你的滚动训练数据时间段很短,以至于期间可能没有训练数据,这里可以设置大一点。0表示没有限制 | 1 | |
输出端 | 滚动配置数据(DataSource pickle) | data | 通用 | 滚动配置数据(DataSource pickle) |
#申万行业指数列表 (sw_industry_code.v5)
获取申万行业列表/指数列表
开发者: iquant
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 申万行业级别 | level | int | 申万行业级别 | 1 |
起始日期 | start_date | str | 起始日期 | 2018-01-01 | |
结束日期 | end_date | str | 结束日期 | 2018-01-01 | |
输出端 | 申万行业指数列表 | data | 通用 | 申万行业指数列表 |
#temp (temp.v1)
temp
开发者: goodchinas
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | input_2 | input_2 | int | 5 | |
input_3 | input_3 | choice | [4, 6] | ||
输出端 | data_1 | data_1 | 通用 |
#test000 (test000.v1)
test000
开发者: ykgong
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#代码过滤 (test001andy.v1)
指定股票列表,过滤数据
开发者: andyinvest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定去除的股票使用逗号分隔 | exclude_stock_list | code | 指定去除的股票使用逗号分隔 | 默认代码 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#代码过滤 (test001andy2.v1)
指定列表,过滤数据
开发者: andyinvest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定去除的股票使用逗号分隔 | exclude_stock_list | code | 指定去除的股票使用逗号分隔 | 默认代码 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#代码过滤 (test001andy3.v1)
指定列表,过滤数据
开发者: andyinvest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 指定去除的股票使用逗号分隔 | exclude_stock_list | code | 指定去除的股票使用逗号分隔 | 默认代码 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#test111 (test111.v1)
test111
开发者: royshu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param | param | int | 1 | |
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 | |||
data_3 | data_3 | 通用 | |||
data_4 | data_4 | 通用 | |||
DATA_5 | DATA_5 | 通用 |
#test123 (test123.v3)
test123
开发者: ykgong
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#test123321 (test123321.v1)
test123321
开发者: user4310
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#test22 (test22.v1)
开发者: 993210oo
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#test332 (test332.v1)
开发者: 993210oo
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#test333 (test333.v2)
开发者: 993210oo
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输出端 | data_1 | data_1 | 通用 | data_1 |
#test789 (test789.v1)
test789
开发者: ykgong
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#test_2021_ht (test_2021_ht.v1)
开发者: polll
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | 2020-01-01 | |
end_date | end_date | str | 2021-05-01 |
#测试 (test_lgd1.v27)
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 参数 | k | int | 参数 | 20 |
代码 | mm | code | 代码 | 默认代码 | |
zifuchuan | sss | str | zifuchuan | ||
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#测试 (test_module.v1)
读取上游数据和日线数据
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 上游数据 | input_1 | 通用 | 上游数据 | *必填 |
输入参数 | 开始日期 | start_date | str | 开始日期 | 2019-01-01 |
结束日期 | end_date | str | 结束日期 | 2020-01-01 | |
表名 | table_name | str | 表名 | bar1d_CN_STOCK_A | |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 | |
行情数据 | data_2 | 通用 | 行情数据 |
#test_tp (test_tp.v2)
开发者: topnheran
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 字段 | fields | choice | 字段 | ['amount', 'close', 'high'] |
开始 | start_date | str | 开始 | 20180101 | |
结束 | end_date | str | 结束 | 20201231 | |
窗口 | window | str | 窗口 | 0D | |
输出端 | pd | data_1 | 通用 | pd.DataFrame |
#test_wyq (test_wyq.v1)
开发者: youknowwyq
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#标准化处理 (testhw1.v1)
对数据进行截面标准化处理
开发者: goodchinas
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
因子列表 | input_2 | 通用 | 因子列表 | *必填 | |
输入参数 | 指定列 | columns_input | code | 指定列 | 默认代码 |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#自定义测试 (testing.v2)
开发者: sszy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#testshu (testshu.v1)
testshu
开发者: royshu
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param | param | int | 1 | |
输出端 | data_1 | data_1 | 通用 | ||
data_2 | data_2 | 通用 | |||
data_3 | data_3 | 通用 | |||
data_4 | data_4 | 通用 | |||
DATA_5 | DATA_5 | 通用 |
#testtest (testtest.v8)
开发者: goodchinas
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | factor | factor | 通用 | *必填 | |
输入参数 | window | window | int | 5 | |
buy_sel_rank | buy_sel_rank | choice | [4, 6] | ||
field | field | str | gxl | ||
asc | asc | bool | *必填 | ||
输出端 | data_1 | data_1 | 通用 | data_1 |
#time (time_fenduan.v1)
开发者: xkk
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#淘利预测数据 (tlaef_pred.v2)
开发者: whitebear
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | model_id | model_id | str | model_id | 57fa9b6a59604791879350cc4c166a71T |
start_date | start_date | str | start_date | 2020-01-01 | |
end_date | end_date | str | end_date | 2020-10-01 |
#修改列名 (tony_rename.v2)
开发者: tonytony
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | input_ds | *必填 |
输入参数 | columns | columns | str | columns | avg_amount_0:new_avg_amount_0|rank_return_0/rank_return_5:return_change_5 |
输出端 | data | data | 通用 | data |
#分批交易天数 (trade_in_bulk_days.v1)
在建仓期或卖出期分批交易的天数
开发者: franklili
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输入参数 | trading_days | trading_days | int | 30 | |
输出端 | data_1 | data_1 | 通用 |
#training_set_accuracy (training_set_accuracy.v1)
计算模型训练集准确率
开发者: kinwaiy_ai
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#trend_of_industry (trend_of_industry.v1)
一段时间申万一级行业的指数走势
开发者: sszy
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 计算开始时间 | start_date | str | 计算开始时间 | 2019-01-01 |
计算结束时间 | end_date | str | 计算结束时间 | 2019-03-22 |
#ts_data_input_zz500 (ts_data_input_zz500.v2)
开发者: stock
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输出端 | data_1 | data_1 | 通用 |
#tt (tt.v4)
测试自定义模块
开发者: timtest
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | *必填 | |
输出端 | 输出 | data_1 | 通用 | 输出 |
#tt123 (tt123.v1)
tt123
开发者: user4310
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param1 | param1 | int | 1 |
#888 (ttt.v1)
888
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#ttt1111 (ttt1111.v1)
ttt1111
开发者: user4310
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param1 | param1 | int | 1 |
#123456 (ttt123.v1)
123456
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | param0 | param0 | int | 3 |
#组合优化-加入行业中性 (update_portfolio_opt.v10)
优化目标:收益,风险,夏普比率,信息比率,风险平价
约束条件:权重,跟踪误差,行业中性
输入:可选,一个pandas.Series
开发者: wallstreetcat
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_1 | input_1 | 通用 | input_1 | *必填 |
输入参数 | 股票列表 | symbols | code | 股票列表 | 默认代码 |
开始日期 | date | str | 开始日期 | 2018-01-02 | |
权重之和 | weight_sum | float | 权重之和 | 1 | |
最大权重 | upper_weight | float | 最大权重 | 0.3 | |
最小权重 | lower_weight | float | 最小权重 | 0.005 | |
向前计算天数 | before_start_days | int | 向前计算天数,默认为一年 | 365 | |
优化目标 | target | choice | 优化目标 | 最 | |
是否在优化失败时返回等权重 | return_equal_weight_if_fail | bool | 是否在优化失败时返回等权重 | True | |
基准指数 | benchmark | code | 基准指数,默认上证50,列表格式 | 默认代码 | |
upper_tracking_error | upper_tracking_error | float | upper_tracking_error | 0.3 | |
lower_tracking_error | lower_tracking_error | float | lower_tracking_error | 0.001 | |
是否进行行业中性约束 | industry_neutral | bool | 是否进行行业中性约束 | *必填 | |
优化函数的容忍度 | tol | float | 优化函数的容忍度,越小越精确 | 1 | |
优化函数的最大迭代次数 | maxiter | int | 优化函数的最大迭代次数,影响计算时间 | 50 | |
输出端 | data_1 | data_1 | 通用 | data_1 |
#userlibtest (userlibtest.v1)
开发者: wangqiyuan
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#50ETF期权波动率指数日K线 (vix_daily.v6)
获取50ETF期权波动率指数日K线
开发者: ganxy1028
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | start_date | 2018-07-01 |
end_date | end_date | str | end_date | 2020-07-31 | |
输出端 | data | data | 通用 | data |
#期权波动率指数 (vixk.v15)
获取期权波动率指数
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | start_date | start_date | str | start_date | 2018-07-01 |
end_date | end_date | str | end_date | 2020-07-31 | |
输出端 | data | data | 通用 | data |
#vol_ratio_5 (vol_ratio_5.v1)
开发者: supertrim258
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#weee (weee.v1)
开发者: fate
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#获取用户微博帖子 (weibo_user_posts_fetcher.v13)
获取指定用户的微博帖子,使用参考 https://bigquant.com/community/t/topic/132125
开发者: think
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 微博用户名 | user_name | str | 微博用户名,例如 花荣 | *必填 |
数量 | count | int | 数量,获取用户的多少条微博数据 | *必填 | |
cookie_SUB | cookie_sub | str | cookie_SUB,微博登录用户的cookie SUB,获取微博数据需要登录 | *必填 | |
输出端 | data_1 | data_1 | 通用 |
#xiecsv (xiecsv.v1)
xiecsv
开发者: wujunjun
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 回测 | input_1 | 通用 | 回测 | *必填 |
特征 | input_2 | 通用 | 特征 | *必填 | |
输出端 | 无 | data_1 | 通用 | 无 |
#xixi (xixi.v1)
开发者: alfred1993
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#处理测试 (xxs.v1)
测试
开发者: daimei
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 参数1 | a | float | 参数1 | 5.0 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#处理 (xxx.v1)
开发者: daimei
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | 参数1 | a | float | 参数1 | 0.1 |
输出端 | 输出数据 | data_1 | 通用 | 输出数据 |
#我的模块 (xxxxX.v1)
xxxx
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 开始日期 | start_date | str | 开始日期 | 2004-01-01 |
结束日期 | end_date | str | 结束日期 | 2015-01-01 |
#y99 (y99.v1)
开发者: ft2728244
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#ywb_number (ywb_number.v2)
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | a | a | int | a | 1 |
输出端 | data_1 | data_1 | 通用 |
#自定义搜索 (ywb_params.v7)
自定义搜索
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据集 | input_1 | 通用 | 训练数据集 | *必填 |
训练特征列表 | input_2 | 通用 | 训练特征列表 | *必填 | |
测试数据集 | input_3 | 通用 | 测试数据集 | *必填 | |
代码列表(通用) | input_4 | 通用 | 代码列表(通用) | *必填 | |
超参标识 | input_5 | 通用 | 超参标识 | *必填 | |
输入参数 | 文件名规则 | filename | str | 文件名规则 | temp |
学习率 | learning_rate | float | 学习率 | 0.1 |
#ywbtest (ywbtest.v1)
ywbtest
开发者: snryang
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | tttt | tttt | 通用 | *必填 | |
输入参数 | param_1 | param_1 | int | *必填 | |
param_2 | param_2 | float | 0.1 | ||
param_3 | param_3 | bool | *必填 | ||
param_4 | param_4 | str | foo | ||
param_5 | param_5 | choice | ['foo', 'bar'] |
#zigzag (zigzag.v1)
开发者: liontain
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | dfSeries | dfSeries | 通用 | *必填 | |
输出端 | dfRes | dfRes | 通用 |
#ss (zzz.v1)
开发者: kobe
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|
#指数增强 (指数增强.v11)
该功能模块主要功能为:在给定的指数成份股中优化选股和仓位以实现指数增强
开发者: chad
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 特征列表 | input_ds1 | 通用 | 特征列表 | *必填 |
输入参数 | 训练集开始日期 | train_start | str | 训练集开始日期 | 2010-01-01 |
训练集结束日期 | train_end | str | 训练集结束日期 | 2015-01-01 | |
验证集开始日期 | test_start | str | 验证集开始日期 | 2016-01-01 | |
验证集结束日期 | test_end | str | 验证集结束日期 | 2018-09-20 | |
换仓周期 | freq | int | 换仓周期,策略默认定期重新按股票排名换仓 | 1 | |
持仓股数 | stock_count | int | 持仓股数,策略持有的股票个数 | 20 | |
个股最大持仓比例 | ratio_max | float | 个股最大持仓比例,允许的个股最高持股比例 | 0.25 | |
仓位配比均匀度 | pos_gradient | float | 仓位配比均匀度,此项越大个股的持仓比例越均匀 | 0 | |
初始资金 | capital_start | float | 初始资金 | 10000000 | |
训练集股票池范围 | market_train | choice | 训练集股票池范围 | 全市场 | |
验证集股票池范围 | market_test | choice | 验证集股票池范围 | 全市场 | |
业绩基准 | benchmark_ins | choice | 业绩基准 | IC0000.CFE | |
输出端 | 回测结果 | data | 通用 | 回测结果 |
#神经网络预测器 (神经网络预测器.v1)
神经网络预测器
开发者: feynman0825
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 训练数据 | input_1 | 通用 | 训练数据 | *必填 |
特征列表 | input_2 | 通用 | 特征列表 | *必填 | |
预测数据 | input_3 | 通用 | 预测数据 | *必填 | |
输入参数 | 隐含层数量 | hidden_layer_sizes | str | 隐含层数量 | 5,10 |
输出端 | 预测值 | data_1 | 通用 | 预测值 |
#绘制单只股票K线图 (绘制单只股票K线图.v1)
绘制单只股票的K线图,目前只支持单子股票
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入参数 | 股票代码 | instrument | str | 股票代码 | 000009.SZA |
开始时间 | start_date | str | 开始时间 | 2018-01-01 | |
结束时间 | end_date | str | 结束时间 | 2018-10-10 | |
短周期均线参数 | sma_length | str | 短周期均线参数 | 10 | |
长周期均线参数 | lma_length | str | 长周期均线参数 | 30 | |
输出端 | K线图数据 | ds | 通用 | K线图数据 |
#股票池初选 (股票池初选.v5)
选股生成器模块
开发者: qhdxlgd
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 输入数据 | input_1 | 通用 | 输入数据 | *必填 |
输入参数 | self_instruments | self_instruments | code | 默认代码 | |
指定概念板块 | input_concepts | code | 指定概念板块 | 默认代码 | |
指定行业 | input_industrys | code | 指定行业 | 默认代码 | |
指数范围 | input_indexs | code | 指数范围 | 默认代码 | |
过滤ST股 | input_st | choice | 过滤ST股 | 过滤 | |
过滤停牌股 | input_suspend | choice | 过滤停牌股 | 过滤 | |
输出端 | 输出数据 | data | 通用 | 输出数据 |
#获取交易信号 (获取交易信号.v7)
获取某日交易信号
开发者: xiaoshao
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | input_ds | input_ds | 通用 | *必填 | |
输入参数 | date | date | str | 2016-12-30 | |
输出端 | data | data | 通用 |
# 示例模块
#提交结果到Challenger (challenger_submit.v1)
提交预测结果到 challenger.ai。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 预测数据 | prediction_ds | 通用 | 预测数据,HDF格式 | *必填 |
输入参数 | 用户名 | account | str | 用户名,一般是你的登陆邮箱 | *必填 |
登陆密码 | password | str | 登陆密码,可以用原始密码,也可以使用密码的md5 | *必填 | |
比赛期数/round | challenge_round | str | 比赛期数/round | 9 | |
比赛类型 | challenge_type | str | 比赛类型,比赛type,可以在比赛页面的html源代码里找到div id="main_content" data-cid="6" data-type="trendsense" data-round="8" | trendsense | |
比赛cid | challenge_cid | str | 比赛cid | 6 |
#Hello BigQuant Module (hellomodule.v1)
这是一个示例模块,用来展示如何创建一个模块。您可以拷贝此模块并修改成你需要的模块。
一个模块应该至少包括一个 bigquant_run 函数。
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 一个数据输入 | input_ds | 通用 | 一个数据输入 | *必填 |
另一个数据输入 | another_input_ds | 通用 | 另一个数据输入 | *必填 | |
输入参数 | 没有限制的int参数 | param1 | int | 没有限制的int参数 | *必填 |
一个int参数 | param2 | int | 一个int参数 | *必填 | |
一个float参数 | param3 | float | 一个float参数 | *必填 | |
choice参数 | param5 | choice | choice参数 | *必填 | |
文本字段 | foo | code | 文本字段 | 默认代码 | |
bool参数 | param7 | bool | bool参数,无默认值 | *必填 | |
简单Python对象 | bar | code | 简单Python对象 | 默认代码 | |
另一个Python对象 | bar1 | code | 另一个Python对象 | 默认代码 | |
Python函数 | bar2 | code | Python函数 | 默认代码 | |
自动完成 | bar3 | code | 自动完成 | 默认代码 | |
bool参数 | param6 | bool | bool参数 | True | |
str参数 | strparam | str | str参数 | some_default_value | |
输出端 | 一个输出数据 | some_ds | 通用 | 一个输出数据 | |
另一个输出数据 | another_ds | 通用 | 另一个输出数据 |
#基础特征抽取(vnext) (vnext_general_feature_extractor.v1)
类别 | 显示名称 | 名称 | 类型 | 描述 | 必填/默认 |
---|---|---|---|---|---|
输入端 | 证券代码列表 | instruments | 通用 | 证券代码列表 | *必填 |
特征列表 | features | 通用 | 特征列表 | *必填 | |
输入参数 | 开始日期 | start_date | str | 开始日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的开始日期 | |
结束日期 | end_date | str | 结束日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的结束日期 | ||
向前取数据天数 | before_start_days | float | 向前取数据天数,比如,用户通过表达式计算的衍生特征,可能需要用到开始日期之前的数据,可以通过设置此值实现,则数据将从 开始日期-向前取数据天数 开始取。考虑到节假日等,建议将此值得大一些 | 90 | |
输出端 | 基础特征数据 | data | 通用 | 基础特征数据 |
文档更新时间:2025-06-12 15:47:12