algorithm - 基于公式消除两个表之间的观察

标签 algorithm loops for-loop foreach stata

我有两个表:

第一个表有名称、日期、时间和日内价格变量。这意味着每个名称在特定日期和时间都有一个盘中价格。 第二个表有名称、日期和每日价格,每日价格是每个名称和日期的日内价格汇总。 我尝试编写一个执行以下过程的程序:

它可以在两个表中按名称和日期找到相同的观察结果,然后:

如果第一个和最后一个盘中价格在最后一天的每日价格的 0.962 和 1.0398 倍之外;然后删除表 1 中与该特定名称和日期相关的所有数据。

语句是:

如果第一个和最后一个(特定名称和日期的盘中价格)不在 [0.962*(昨天的每日价格),1.0398*(昨天的每日价格)] 中,则删除。

例如,考虑下面的两个表:

* Example generated by -dataex-. To install: ssc install dataex
clear
input str4 name long date str8 time double intraday_price
"A" 17659 "11:32:41"    3
"A" 17659 "12:32:41"    2
"A" 17659 "13:32:41"    1
"A" 17660 "11:32:41" 3.95
"A" 17660 "12:32:41"    3
"A" 17660 "13:32:41"    6
"A" 17660 "14:32:41" 4.01
"B" 17659 "11:32:41"  3.1
"B" 17659 "12:32:41"    1
"B" 17659 "13:32:41"    4
"B" 17659 "14:32:41"  2.9
"B" 17660 "11:32:41"    6
"B" 17660 "12:32:41"    1
"B" 17661 "11:32:41"    5
"B" 17661 "12:32:41"    7
"C" 17659 "11:32:41"    3
"C" 17659 "12:32:41"    2
"C" 17660 "11:32:41"  6.1
"C" 17660 "12:32:41"    3
"C" 17660 "13:32:41"    2
"C" 17661 "11:32:41"    8
"C" 17661 "12:32:41"    2
"C" 17661 "13:32:41"    3
"C" 17661 "14:32:41"    2
end
format %d date

表2是:

* Example generated by -dataex-. To install: ssc install dataex
clear
input str4 name long date double daily_price
"A" 17657 3
"B" 17657 6
"C" 17657 5
"A" 17658 5
"A" 17659 4
"B" 17658 3
"B" 17659 4
"B" 17660 3
"C" 17658 7
"C" 17659 6
"C" 17660 5
end
format %d date

请考虑在公式中使用昨天的每日价格。

所以结果是:

+------+----------+----------+----------------+
| name |   date   |   time   | intraday price |
+------+----------+----------+----------------+
| B    | 7-May-08 | 11:32:41 |            3.1 |
| B    | 7-May-08 | 12:32:41 |              1 |
| B    | 7-May-08 | 13:32:41 |              4 |
| B    | 7-May-08 | 14:32:41 |            2.9 |
| A    | 8-May-08 | 11:32:41 |           3.95 |
| A    | 8-May-08 | 12:32:41 |              3 |
| A    | 8-May-08 | 13:32:41 |              6 |
| A    | 8-May-08 | 14:32:41 |           4.01 |
| C    | 8-May-08 | 11:32:41 |            6.1 |
| C    | 8-May-08 | 12:32:41 |              3 |
| C    | 8-May-08 | 13:32:41 |              2 |
+------+----------+----------+----------------+

你能告诉我怎么做吗?

最佳答案

你的问题不是很清楚,我确定这是否是你想要的,而且你还有很多缺失的数据(表 2 中的姓名日期与表中的姓名日期不匹配1),所以让我知道这是否达到了您的要求。

本质上,我们将两个表都创建为临时文件。对于表 2,我们首先为数据中最后一天之后的那一天创建一个值,因为我们需要一个“最后一天价格”变量。然后我们创建“最后一天价格”变量(我们可以在技术上使用时间序列运算符稍后执行此操作,但这有点简单)。然后我们将表 2 合并到表 1。我放弃任何没有日内价格的观察,因为我假设这些与您无关,然后使用 bysort 创建一个指标来判断您是否应该放弃。我注释掉了我们实际删除的部分,因此您可以先观察您的数据,以确保它达到您真正想要的。

首先,输入您的数据:

    clear
    tempfile table1 table2

//  Input data
    input str4 name long date str8 time double intraday_price
    "A" 17659 "11:32:41"    3
    "A" 17659 "12:32:41"    2
    "A" 17659 "13:32:41"    1
    "A" 17660 "11:32:41" 3.95
    "A" 17660 "12:32:41"    3
    "A" 17660 "13:32:41"    6
    "A" 17660 "14:32:41" 4.01
    "B" 17659 "11:32:41"  3.1
    "B" 17659 "12:32:41"    1
    "B" 17659 "13:32:41"    4
    "B" 17659 "14:32:41"  2.9
    "B" 17660 "11:32:41"    6
    "B" 17660 "12:32:41"    1
    "B" 17661 "11:32:41"    5
    "B" 17661 "12:32:41"    7
    "C" 17659 "11:32:41"    3
    "C" 17659 "12:32:41"    2
    "C" 17660 "11:32:41"  6.1
    "C" 17660 "12:32:41"    3
    "C" 17660 "13:32:41"    2
    "C" 17661 "11:32:41"    8
    "C" 17661 "12:32:41"    2
    "C" 17661 "13:32:41"    3
    "C" 17661 "14:32:41"    2
    end
    format %d date

    save `table1'

    clear
    input str4 name long date double daily_price
    "A" 17657 3
    "B" 17657 6
    "C" 17657 5
    "A" 17658 5
    "A" 17659 4
    "B" 17658 3
    "B" 17659 4
    "B" 17660 3
    "C" 17658 7
    "C" 17659 6
    "C" 17660 5
    end
    format %d date

现在,进行更改:

//  Create a new observation to create a "lastday_price" for the day AFTER the last day in the data
    levelsof name, local(names)
    foreach name of local names {
        set obs  `=_N+1'
        replace name = "`name'" if missing(name)
    }
    sort name date

//  Generate lastday_price
    bysort name (date): gen lastday_price = daily_price[_n-1]
    bysort name (date): replace date = date[_n-1] + 1 if missing(date)
    save `table2'

//  Merge table 2 onto table 1 by name and date
    use `table1', clear
    merge m:1 name date using `table2'
        drop if _merge == 2     // Only daily prices, no intra_day price

//  Generate indicator for whether or not to drop
    bysort name date (time): gen drop = 1 if    ///
        !inrange(intraday_price[1],0.962*lastday_price,1.0398*lastday_price) &  ///
        !inrange(intraday_price[_N],0.962*lastday_price,1.0398*lastday_price) & ///
        !missing(lastday_price)

*drop if drop == 1

关于algorithm - 基于公式消除两个表之间的观察,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49650580/

相关文章:

vb.net - 使用 VB.NET 基于长度和字体居中文本的算法

c++ - 用for循环替换if else?

c - Luhn 算法的 for 循环中的未知值

c - 如何检查两个数组是否在 C 中互为镜像?

loops - Netlogo while 循环仅一次

matlab - Mat循环的for循环矢量处理RGB图像中的像素

c++ - 在 <algorithm> 库的 find_if 中用作谓词的函数要求是什么?

c++ - 使用固定数量的整数对 vector 进行排序

java - 找到差异最小的回文

javascript - for (x in y) VS for (i = 0; i < y.length; i++) 其中 x 是对象数组