hadoop - hadoop用例与有效贷款数据

标签 hadoop use-case

我在TXT文件中有一些贷款获取的重要数据集
注意-最近3季度的数据可供我使用。

另外,请在图像文件中找到“获取文件”每一列的字段描述。

1)您能否帮助我生成-我想使用HDFS和Mapreduce JAVA编程实现的VALID逻辑业务用例

因为大多数示例使用案例-与字数统计和天气数据分析有关。

要获取数据文件-只需登录

数据-文件

链接---------- 贷款性能data.fanniemae.com/lppub-docs/acquisition-sample-file.txt

100009503314 |通讯社|不列颠富国银行| 3.75 | 320000 | 360 | 12/2011 | 02/2012 | 67 | 67 | 1 | 32 | 798 | NO | PURCHASE | PUD | 1 | PRINCIPAL | CA | 949 || FRM

100010175842 | RETAIL | OTHER | 3.875 | 255000 | 360 | 02/2012 | 04/2012 | 73 | 73 | 1 | 49 | 778 | NO | NO Cash-out Finance | SF | 1 | PRINCIPAL | OH | 432 || FRM

100013227768 |经纪人| FLAGSTAR CAPITAL MARKETS CORPORATION | 3.875 | 415000 | 360 | 12/2011 | 03/2012 | 46 | 46 | 2 | 21 | 780 |否|无兑现性融资| PUD | 1 |主要客户| VA | 223 || FRM

100016880542 | RETAIL | WELLS FARGO BANK,N.A. | 4.25 | 417000 | 360 | 11/2011 | 012012 | 90 | 90 | 2 | 40 | 794 | NO |购买| SF | 1 | PRINCIPAL | CA | 956 | 25 | FRM

2)数据的列说明

链接- loanperformancedata.fanniemae.com/lppub-docs/lppub_file_layout.pdf

贷款标识符
channel
卖方名称
原始利率
原始未付款主余额(UPB)
原始贷款期限
成立日期
首次付款日期
原始贷款增值(LTV)
原始组合贷款至值(value)
借款人数
债务- yield 比率
信用评分
首次购房者指标
贷款目的
属性(property)类型
单位数
占用状态
属性(property)状态
zip (3-数字)
抵押保险百分比
产品类别

链接-------> loanperformancedata.fanniemae.com/lppub-docs/lppub_glossary.pdf

请帮助我-构建一些有效的业务用例和Java程序以实现它们。

-Hadoop的大多数数据是-天气计数和字数统计示例:(

最佳答案

您可以进行简单的过滤和汇总,以识别具有最大贷款数量和最小信用评分的状态。这可能有助于洞悉违约率高得多的批准贷款的问题。

关于hadoop - hadoop用例与有效贷款数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24236605/

相关文章:

hadoop - 轻快地处理小文件

hadoop - 如何将NLTK与Hadoop HDFS集成?

uml - 有没有办法为用例增加时间?

uml - 正确指定主要/次要参与者(UML 用例图)

uml - 如果每个用户都有自己的一组任务,如何在事件图中表示两个用户之间的共同任务?

scala - 从文件读取的 flatMap 结果与作为字符串传递的同一行不同

java - MapReduce代码清理登台区域错误

date - 如何在 Hadoop Hive 中给定时间戳获取一周第一天的日期?

database - 级联删除用例

uml - 用例图的理想示例