javascript - 从 html 正文中提取 URL 以获取 Gmail 插件中的特定链接文本

标签 javascript html google-apps-script gmail-addons

我正在尝试从包含“猫”链接文本的 HTML 文档(Gmail 电子邮件)中获取 href

例如我想从位于 html 文档中任何位置的以下链接中提取 URL

<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">cats</a>
or 
<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">yay cats</a>

注意:我正在构建 Gmail 附加组件

最佳答案

使用 Gmail Addon 正则表达式在电子邮件中查找链接和其他内容

这是一个正则表达式测试器,因此它可能比您预期的要多,但它会找到您正在寻找的链接以及您希望找到的任何其他链接。这个将满足您当前的需求:<.*q=cats.*> .当前使用的正则表达式函数是 String.match 你可以找到它的解释 here页面底部有一个 url,它应该指向电子表格,该电子表格包含名为“默认”的页面,如后所述。

function buildAddOn(e) {
  var accessToken = e.messageMetadata.accessToken;
  GmailApp.setCurrentMessageAccessToken(accessToken);
  var msg=GmailApp.getMessageById(e.messageMetadata.messageId).getPlainBody();
  setDefaults({message:msg});
  var cards = [];
  cards.push(buildRegexTester(getDefaults()));
  return cards;
}

function buildRegexTester(dfltObj){
  var card=CardService.newCardBuilder();
  card.setHeader(CardService.newCardHeader().setTitle('Regex Tester'));
  var section=CardService.newCardSection().setHeader('Email Body Search');
  var plainBodyText=CardService.newTextParagraph().setText(dfltObj.message);
  section.addWidget(plainBodyText)
  var saveRegexButton=CardService.newTextButton().setText('Save Regex').setOnClickAction(CardService.newAction().setFunctionName('saveRegex'));
  section.addWidget(saveRegexButton);
  var regexTextBox=CardService.newTextInput()
  .setFieldName('Regex')
  .setTitle('Regex')
  .setMultiline(true)
  .setValue(dfltObj.Regex);
  section.addWidget(regexTextBox);
  var searchButton=CardService.newTextButton().setText('Search').setOnClickAction(CardService.newAction().setFunctionName('search')); 
  section.addWidget(searchButton);
  var regexResultBox=CardService.newTextInput()
  .setFieldName('Results')
  .setTitle('Results')
  .setMultiline(true)
  .setValue(dfltObj.results);
  section.addWidget(regexResultBox);
  var clearResultsButton=CardService.newTextButton().setText('Clear Results').setOnClickAction(CardService.newAction().setFunctionName('clearResults'));
  section.addWidget(clearResultsButton)
  var g_toggle=CardService.newKeyValue()
  .setContent('global search')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.g)
            .setFieldName('g')
            .setValue('g')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(g_toggle);
  var i_toggle=CardService.newKeyValue()
  .setContent('ignore case')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.i)
            .setFieldName('i')
            .setValue('i')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(i_toggle);
  var m_toggle=CardService.newKeyValue()
  .setContent('multiline search')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.m)
            .setFieldName('m')
            .setValue('m')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(m_toggle);
  card.addSection(section);
  return card.build();
}

function getDefaults(){
  var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
  var sh=ss.getSheetByName('Defaults');
  var rg=sh.getDataRange();
  var vA=rg.getValues();
  var dfltObj={};
  for(var i=0;i<vA.length;i++){
    dfltObj[vA[i][0]]=vA[i][1];
  }
  return dfltObj;
}

function setDefaults(dfltObj){
  var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
  var sh=ss.getSheetByName('Defaults');
  var rg=sh.getDataRange();
  var vA=rg.getValues();
  for(var i=0;i<vA.length;i++){
    if(typeof(dfltObj[vA[i][0]])!='undefined'){
      vA[i][1]=dfltObj[vA[i][0]];
    } 
  }
  rg.setValues(vA);
}

function saveFlags(e){
  Logger.log('\nsaveFlags():\n%s\n',e);
  var g=(typeof(e.formInput.g)!='undefined')?true:false;
  var i=(typeof(e.formInput.i)!='undefined')?true:false;
  var m=(typeof(e.formInput.m)!='undefined')?true:false;
  var flagObj={g:g,i:i,m:m};
  setDefaults(flagObj);
}

function saveRegex(e){
  Logger.log('\nsaveRegex():\n%s',e);
  var regex=(typeof(e.formInput.Regex)!='undefined')?e.formInput.Regex:'';
  if(regex){
    var rObj={Regex:regex};
    setDefaults(rObj);
  }
}

function saveResults(rsltObj){
  setDefaults(rsltObj);
}

function getFlags(){
  var dfltObj=getDefaults();
  var flagsA=[];
  if(dfltObj.g){flagsA.push('g');}
  if(dfltObj.i){flagsA.push('i');}
  if(dfltObj.m){flagsA.push('m');}
  var flags=flagsA.join('');
  return flags;  
}

function search(e){
  Logger.log('\nSearch():\n%s',e);
  if(typeof(e.formInput.Regex)!='undefined'){
    saveFlags(e);
    saveRegex(e);
    var dfltObj=getDefaults();
    var flags=getFlags();
    var pattern=dfltObj.Regex;
    Logger.log('\nflags: %s\npattern: %s',flags,pattern);
    var re=new RegExp(pattern,flags);
    //var result=re.exec(dfltObj.message);
    var result=dfltObj.message.match(re);
    if(result) {
      Logger.log('\nresult: %s\nmessage:',result,dfltObj.message);
      if(result){
        var rsltLog='';
        for(var i=0;i<result.length;i++){
          if(i>0){rsltLog+='\n'};
          rsltLog+='result[' + i + ']= ' + result[i];
        }
      }
      console.log('module: %s pattern: %s regex: %s flags: %s result: %s length: %s',"findData()",pattern,re,flags,rsltLog,result.length);
    }
    if(result){
      var results=rsltLog;
    }else{
      var results="No Results";
    }
    //var rsltObj={results:results};
    var rsltObj={results:escapeHtml(results)};
    saveResults(rsltObj);
    return buildRegexTester(getDefaults());
  }
}

function clearResults(e){
  var dfltObj=getDefaults();
  dfltObj.results='';
  return buildRegexTester(dfltObj);
}

//Came From: @Kip https://stackoverflow.com/a/4835406/7215091
function escapeHtml(text) {
  var map = {
    '&': '&amp;',
    '<': '&lt;',
    '>': '&gt;',
    '"': '&quot;',
    "'": '&#039;'
  };

  return text.replace(/[&<>"']/g, function(m) { return map[m]; });
}

var RegexTesterAddon_URL='link to a spreadsheet that contain defaults';

电子表格必须有一个名为 Defaults 的页面,它看起来像这样:

enter image description here

该页面仅使用 A 列和 B 列,并且必须具有如图所示的消息、正则表达式、g、i、m 和结果。 g,i,m 的典型设置是 TRUE、FALSE、FALSE,这将使您入门。此正则表达式适用于您当前的要求 <.*q=cats.*>

关于javascript - 从 html 正文中提取 URL 以获取 Gmail 插件中的特定链接文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54918801/

相关文章:

JavaScript 数字 MIN_VALUE 是如何工作的?

javascript - 为什么在 JavaScript 中 "Object instanceof Function"和 "Function instanceof Object"都返回 true?

javascript - 使用外部 API 调用和 findOneAndUpdate 循环结果

html - 悬停时增加 div 的高度但仅使用 CSS ...为什么?

javascript - 使用 React 和 Google App 脚本将文件上传到 Google Drive

javascript - 导航丸不工作

html - 将鼠标悬停在其中一个元素上时,如何突出显示 tr 元素的前 2 个 td 元素?

php - 无法编辑 overflow-x :hidden

google-apps-script - 使用 Include 时 Apps 脚本边栏引用错误

google-apps-script - 使用谷歌表格中的复选框来运行宏