我知道这个问题已经被问过很多次了,但是由于我对 SQL 还很陌生,因此根据我的目的修改以前的答案有点困难。我基本上已经解决了问题,但在排除重复案例的同时,要让枢轴发挥作用,我遇到了很大的困难。问题是我对语法还不够熟悉,还无法适当调整。
我目前的数据看起来像这样(简单版本):
----------------------------------------------------------
| **Medication** | **Patient_ID** |
----------------------------------------------------------
| Amlopidine | 100123 |
----------------------------------------------------------
| Lisinopril | 100123 |
----------------------------------------------------------
| Eprosartan | 200415 |
----------------------------------------------------------
我希望有这样的事情:
------------------------------------------------------------------------------
| **Patent_ID** | **MED_1** | **MED_2** |
------------------------------------------------------------------------------
| 100123 | Amlopidine | Lisinopril |
------------------------------------------------------------------------------
| 200415 | Eprosartan | NULL |
------------------------------------------------------------------------------
我遇到的问题是,患者多年来可能多次服用相同的药物,导致表格中有大量重复,这正是我试图避免的。
到目前为止我的代码(IndicatorValue = 药物):
DECLARE @cols AS NVARCHAR(MAX),
@query AS NVARCHAR(MAX)
SELECT @cols = STUFF((SELECT ',' + QUOTENAME(col+'_'+cast(rn as varchar(10)))
FROM
(
SELECT row_number() OVER(PARTITION BY Patient_ID
ORDER BY IndicatorValue) rn
FROM dbo.DiseaseCaseIndicator
) t
cross join
(
select DISTINCT 'IndicatorValue' col
) c
group by col, rn
order by rn, col
FOR XML PATH(''), TYPE
).value('.', 'NVARCHAR(MAX)')
,1,1,'')
set @query = 'SELECT Patient_ID,' + @cols + '
from
(
select Patient_ID,
col+''_''+cast(rn as varchar(10)) col,
value
from
(
select DISTINCT IndicatorValue, Patient_ID,
row_number() over(partition by Patient_ID
order by IndicatorValue) rn
from dbo.DiseaseCaseIndicator WHERE Patient_ID IN (SELECT Patient_ID FROM dbo.HTPatients) AND IndicatorType = ''Medication'' AND Disease = ''Hypertension''
) d
cross apply
(
values (''IndicatorValue'', IndicatorValue)
) c (col, value)
) t
pivot
(
max(value)
for col in (' + @cols + ')
) p '
execute(@query);
相当粗糙,我知道,但是我还有很多 SQL 需要学习!
因此,主要问题将涉及删除那些残酷的重复项。另外,我有很多列,因为我仍然不太清楚 row_number() 函数是如何实现的。我知道我最多只需要 10 列药物,因为只有少数患者拥有那么多独特的药物。另外:这个表格格式的原因是因为主管的要求。
如果你们能提供任何见解,我们将不胜感激!!
最佳答案
这是使用 dynamic crosstab 的一种方法:
DECLARE @sql NVARCHAR(MAX) = N''
SELECT @sql =
'SELECT
Patient_ID' + CHAR(10)
SELECT @sql = @sql +
' , MAX(CASE WHEN rn = ' + CONVERT(VARCHAR(10), rn) +' THEN Medication END) AS '
+ QUOTENAME('MED_' + CONVERT(VARCHAR(10), rn)) + CHAR(10)
FROM (
SELECT DISTINCT rn = DENSE_RANK() OVER(PARTITION BY Patient_ID ORDER BY Medication)
FROM tbl
) t
SELECT @sql = @sql +
'FROM (
SELECT *,
rn = DENSE_RANK() OVER(PARTITION BY Patient_ID ORDER BY Medication)
FROM tbl
) t
GROUP BY t.Patient_ID
ORDER BY t.Patient_ID'
PRINT (@sql)
EXEC (@sql)
关于sql-server - SQL : Distinct Medications to Columns Using Pivot,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35448280/